はい、ではこの興味深い「サンクトペテルブルクのパラドックス」についてお話ししましょう。
サンクトペテルブルクのパラドックスとは?
これは、「理論上は莫大な利益が見込めるが、実際には手を出せば馬鹿を見る」ようなコインゲームだと想像してみてください。
まず、このゲームのルールを見てみましょう
仮に私たちがゲームをするとしましょう。ルールは非常にシンプルです。
- まず、あなたが入場料を私に支払います。
- 私が完全に公平なコインを投げ始めます。
- もし1回目で表が出たら、ゲームは終了。私はあなたに2元支払います。
- もし1回目で裏が出たら、もう一度投げます。2回目で表が出たら、ゲームは終了。私はあなたに4元支払います。
- もし2回目も裏が出たら、3回目を投げます。3回目で表が出たら、ゲームは終了。私はあなたに8元支払います。
- …というように、裏が出るたびに賞金は倍になり、表が出るまで続きます。
さて、問題です。このゲームをプレイするために、あなたなら最大でいくらの「入場料」を支払いますか?
まず、直感で考えてみてください。
ほとんどの人の第一印象はこうかもしれません。「うーん…1回目で当たる確率は50%で2元もらえる。2回目で当たる確率は25%で4元もらえる。せいぜい5元とか10元くらいで遊ぶのが上限かな?」
この考え方はごく自然で、私たち一般人の直感とよく一致します。
パラドックス(矛盾)はどこにあるのか?
矛盾は、数学者が算出した「期待値」(Expected Value)にあります。
「期待値」とは? 簡単に言えば、この賭けの「平均的な収益」です。もしこのゲームを無限回プレイできるなら、獲得した全てのお金を合計し、プレイ回数で割った平均値が期待値です。合理的な意思決定においては、あなたが支払うことを厭わない最高額は、この期待値であるべきだとされます。
では、計算してみましょう。
- 1/2の確率で、あなたは1回目に表を出し、2元を獲得します。期待値への貢献は:(1/2) * 2 = 1元。
- 1/4の確率で、あなたは2回目に表を出し、4元を獲得します。期待値への貢献は:(1/4) * 4 = 1元。
- 1/8の確率で、あなたは3回目に表を出し、8元を獲得します。期待値への貢献は:(1/8) * 8 = 1元。
- 1/16の確率で、あなたは4回目に表を出し、16元を獲得します。期待値への貢献は:(1/16) * 16 = 1元。
- …これはずっと計算し続けることができます。
すると、このゲームの総期待値は、全ての可能性の貢献を合計したものになります。
期待値 = 1 + 1 + 1 + 1 + 1 + ... = ∞ (無限大)
ここにパラドックスが生まれるのです。
- 数学的な計算が示すこと:このゲームの期待収益は無限大なので、理論上、入場料がいくら高くても(たとえ1億元であっても)、あなたは参加すべきです。「長期的には」確実に儲かるからです。
- あなたの直感が示すこと:正気ですか?私はこのゲームに大金を払ってまで遊びません!ほとんどの場合、2元か4元をもらって終わりでしょう。ごくわずかな確率でしか出ない超高額賞金のために、全財産を賭けるなんて、ありえません。
これがサンクトペテルブルクのパラドックスです。数学的には「絶対にお得」な意思決定が、現実では非常にばかげているように見えるのです。
なぜこうなるのか?このパラドックスをどう説明すればよいか?
このパラドックスは多くの人々を悩ませました。その後、経済学者や数学者たちは、非常に現実的な説明をいくつか提示し、意思決定理論における重要な概念を生み出すことにもなりました。
1. 限界効用逓減 (Diminishing Marginal Utility)
これは最も古典的で重要な説明です。
その意味するところは:お金のあなたにとっての価値は、常に一定ではない、ということです。
例を挙げましょう。
- あなたが飢え死に寸前だと仮定しましょう。この時、100元を与えられれば、それはまさに命の恩人であり、この100元の「幸福感」や「効用」は非常に高いでしょう。
- あなたがすでに億万長者だと仮定しましょう。私がさらに100元与えても、あなたはまぶた一つ動かさないかもしれません。この100元はあなたにとって、ほとんど何の追加的な幸福感ももたらさないでしょう。
私たちのゲームに戻って考えてみましょう。
- 0元から2元に勝てば、とても嬉しいです。
- 2元から4元に勝つのも、悪くありません。
- しかし、100万元から200万元に勝つことによる喜びは、0元から100万元に勝つことによる喜びほど強くはありません。
- あなたが勝つお金がある程度の額(例えば数千万元)に達すると、そこから倍になってもあなたの生活に実質的な変化をもたらすことはなく、その「効用」の増加は非常に緩やかになります。
したがって、私たちが意思決定をする際、実際に測っているのはお金の「数値」ではなく、お金が私たちにもたらす「効用」(満足感)です。もし「効用」を使って期待値を計算すれば、その合計は無限大ではなく、有限で比較的小さな数字になります。この数字は、あなたが直感的に支払ってもよいと思う数元の金額と非常に近いでしょう。
2. 現実世界の制約
パラドックスの計算は理想的なモデルに基づいていますが、現実世界はそれほど理想的ではありません。
- 胴元は無限に裕福ではない:誰があなたとこのゲームをしますか?もしコインが数十回連続で裏を出した場合、賞金は天文学的な数字(例えば世界のGDP総和を超える)になり、胴元は到底支払うことができません。胴元の支払い能力に上限がある以上、このゲームの期待値も無限大ではなく、有限なものとなります。
- あなたの資金も有限である:あなたは、このゲームで大金を当てるまで何度も繰り返しプレイできるほど無限の資金を持っているわけではありません。
3. リスク回避 (Risk Aversion)
ほとんどの人はリスクを嫌います。
- 確実性:手の中にある10元は、紛れもない10元です。
- 不確実性:このゲームは期待値が無限大であるとはいえ、あなたは高確率で2元か4元しか勝てません。ほとんど無視できるほどの小さな確率(例えば20回連続で裏が出るなど)のために巨額の賞金を狙うのは、あまりにもリスクが大きすぎます。
人々は、確実で小さいながらもそこそこ良い利益を好み、確率が極めて低く、利益が極めて高い「夢」に賭けることはしません。
まとめ
サンクトペテルブルクのパラドックスは、数学自体に問題があるのではなく、ある深い真理を明らかにしています。
純粋な数学的期待値モデルは、人間の複雑な意思決定行動を完全に説明することはできません。
人々が意思決定をする際には、お金の実際の効用、現実における様々な制約、そして自身のリスク回避の度合いを考慮します。このパラドックスは、経済学や意思決定理論の発展を大きく推進し、「価値」が「価格」よりも主観的で複雑な概念であることを私たちに理解させました。