双信封悖论是什么?应该怎样理解?

Tina Newton
Tina Newton

好的,没问题!咱们用聊天的感觉来把这个有意思的悖论说清楚。


什么是双信封悖论?

想象一下,你正在参加一个电视节目,主持人拿给你两个一模一样的信封,并告诉你:

  1. 其中一个信封里的钱是另一个的两倍。
  2. 你不知道具体是多少钱,但规则就是这样。

现在,你随机选了一个信封,我们叫它信封A。在打开它之前,主持人给你最后一次机会:“你要不要换成另一个信得(信封B)?”

这时候,你可能会想,换不换都一样吧,概率都是50/50。

但这时,一个“聪明”的念头冒了出来,你开始这样推理:

  1. 假设我手里的信封A里有 X 元。
  2. 那么,信封B里的钱,有 50% 的概率是A的两倍,也就是 2X 元。
  3. 同时,也有 50% 的概率是A的一半,也就是 X/2 元。
  4. 那么,我如果换成信封B,我能拿到的钱的“期望值”(可以理解为平均收益)是多少呢?
  5. 计算一下:期望值 E = (50% 的概率 * 拿到 2X) + (50% 的概率 * 拿到 X/2) = 0.5 * (2X) + 0.5 * (X/2) = X + 0.25X = 1.25X
  6. 哇! 期望值是 1.25X,比我手里现在的 X 要多!所以,我应该换!

这个推理看起来天衣无缝。但最诡异的地方在于,这个结论和你手里有多少钱(X是多少)完全没关系。这意味着,即使你换到了信封B,你依然可以根据同样的逻辑,得出“应该再换回信封A”的结论。这就形成了一个无限循环的“换换换”的怪圈。

这就是双信封悖论:一个看似完美的数学推理,得出了一个在现实中非常荒谬的结论——“永远应该交换”。


应该怎样理解这个悖论?

这个悖论听起来是不是很绕?别担心,它的问题出在一个非常狡猾的逻辑陷阱上。上面的那个“聪明”的推理其实是错的。

错误的核心在于:它混淆了两个完全不同的情况,并错误地使用了变量“X”。

让我们放慢速度,把问题看得更清楚一点。

1. “X”到底代表什么?

在那个错误的推理里,“X”被当成了一个固定的、已知的值。但实际上,你手里的钱(X)本身就是不确定的。

让我们从主持人的角度来看看这个游戏是怎么设置的。主持人准备钱的时候,他不是先想一个“X”,然后再准备一个“2X”和一个“X/2”。

他是这样准备的:

  • 先确定一个较小的金额,我们叫它 A 元。
  • 然后在另一个信封里放入它的两倍,也就是 2A 元。

所以,这两个信封里装的钱从一开始就是 (A, 2A) 这一对。

现在,你来选。你有两种可能:

  • 情况一: 你拿到了装有 A 元的那个信封。这时,你手里的 X = A。如果你换,你就会得到 2A。你赚了 A 元。
  • 情况二: 你拿到了装有 2A 元的那个信封。这时,你手里的 X = 2A。如果你换,你就会得到 A。你亏了 A 元。

在你打开信封之前,这两种情况发生的概率都是50%。

所以,你“交换”这个行为的真实期望收益是: 期望收益 = (50% 的概率赚 A) + (50% 的概率亏 A) = 0.5 * (+A) + 0.5 * (-A) = 0

期望收益是0! 这意味着,从概率上讲,换和不换的长期收益是完全一样的。这完全符合我们的直觉。

2. 那为什么 1.25X 的计算是错的?

那个经典的错误计算 E = 0.5 * (2X) + 0.5 * (X/2) = 1.25X 错在它把上面说的两种情况硬生生揉在了一起。

  • 当它计算 0.5 * (2X) 时,它默认你手里拿的是小数额(你手里的 X 其实是 A)。
  • 当它计算 0.5 * (X/2) 时,它又默认你手里拿的是大数额(你手里的 X 其实是 2A)。

一个变量 X 在同一个公式里,一会儿代表小数额 A,一会儿代表大数额 2A,这就出问题了。你不能用一个含义不确定的变量去做计算。

3. 打开信封后,情况会变吗?

这才是这个悖论最有趣的地方。一旦你打开了信封,情况就变了!

假设你打开了信封,发现里面是 100元

现在 X = 100 是一个已知信息了。这时,另一个信封里的钱只可能是两种情况:

  • 可能是 200 元 (如果原来的钱对是 (100, 200))
  • 也可能是 50 元 (如果原来的钱对是 (50, 100))

这时,你该不该换,就取决于你觉得 (100, 200)(50, 100) 这两对钱,哪一对被主持人选中的可能性更大了。

  • 举个例子: 如果你觉得主持人是个穷鬼,他准备1000块钱的可能性比准备10块钱的可能性小得多。那么当你看到手里是10000元时,你可能会强烈地认为另一个信封里是5000元,而不是20000元。这时你就不会换。
  • 反过来,如果你看到手里只有10元,你可能会觉得另一个信封里是20元的可能性,远大于5元的可能性。这时你就会换。

所以,一旦你获得了信息(看到了信封里的钱),你的决策就不再是简单的50/50了,而是变成了基于这个信息和你对主持人行为的猜测来进行的判断。


总结一下

  1. 悖论的来源:双信封悖论来自于一个看似正确、实则错误的数学推理,这个推理得出了“永远应该交换”的荒谬结论。
  2. 核心错误:错误的推理在一个公式里混淆了变量“X”的含义,让它同时代表了两种不同情况下的金额。
  3. 正确的理解(不打开信封):在未打开信封前,换与不换的期望收益是完全相等的,都是0。所以换不换都一样。
  4. 正确的理解(打开信封后):一旦打开信封看到了具体的金额,你就获得了新的信息。这时,你是否交换的决定,取决于你对“主持人当初是如何选择金额”的判断和猜测。

所以,下次再有人拿这个问题“考验”你,你就可以告诉他:那个算出1.25X的算法是个聪明的骗局,它在玩一个变量混淆的数学魔术!