2020年4月2日木曜日

フェアなコイントス

確率論は、ギャンブルの戦略から大いに発展しています。
故に、確率を理解する時や、問題の中に、ギャンブルを題材としたものは多いです。

ただし、そこは理論の世界。特にマルチンゲールという特殊な確率過程のクラスを考えるとき、フェアなギャンブル、つまり期待値0のギャンブルという状況をよく考えます。

これに関する問題を一つ紹介します。

ちなみに、英語で、コインの表はHead、裏はTailなので、一般にコイントスの結果をHTTHHH・・・という風に書きます。

この時、例えばHTHTHTという結果を得るために必要なトスの試行回数の平均(期待値)を求めたいというのが今回のテーマです。

次のような状況を考えます。
1)コインの各試行は独立で、表裏が出る確率はそれぞれ二分の一。
2)次のコインの結果に対して、賭けをし、当たれば賭けた金が倍になり、外せばすべて失う。(なので期待値0のフェアな賭け)
3)各試行で、新しいプレイヤーが、まず1ポンドをHに賭けます。
4)買った場合は、次に手持ちの財産すべて(2ポンド)をTに賭ける。
負けた場合は即終了し、去る。
5)以降、勝ち続けている場合は、HTHTHTの順に手持ちの財産をすべて賭け続ける。

初めて、HTHTHTという列を得られた時の、最後のTが出た時点をSと置きます。(Sはstopping time。期待値は有限と証明できる)
n回目の試行での、カジノ側の収益(プレイヤーの賭けたお金の合計ープレイヤーが勝ったお金の合計)をX(n)と置きます。

この時、Optional stopping theoremという定理から、X(S)の期待値がX(0)の期待値と等しいと言えます。つまり、HTHTHTが出たとき期待されるカジノの儲けは0ポンド、E(X(S))=0です。
なお、状況設定から、Sはプレイヤーが賭けた金額の合計と等しくなります。
また、S回目の試行が終わった時、
HTHTHTの予測を当てたプレイヤー、HTHTの予測を当てたプレイヤー、HTの予測を当てたプレイヤーが存在しており、各々2^6,2^4,2^2ポンドを手にしています。

故に、0=2^6+2^4+2^2-E(S)が成り立ち、E(S)=84と求められます。

またこの結果から、最も期待値が大きくなってしまう賭け(成立するまでに時間がかかる長さ6の列)は、HHHHHH(あるいはTTTTTT)で平均126試行(2+4+8+16+32+64=2*(2^6-1))を要するのに対して、
一番短いものはHHHHHTなどで平均64回の試行を要するという結論を導けます。

HHHHHHが一番出にくいのはなんとなく腑に落ちますが、その一方でHHHHHTが一番すぐに出てくるって面白くないですか?
上の結論を得るために、マルチンゲール、停止時刻などの概念が利用されています。これを考えるために、確率空間や、情報系などの理論が必要になるので、1学期に測度論の授業で勉強した内容ですが、なんだかんだ学期の後半に漸く導けるようになる理論でした笑

0 件のコメント:

コメントを投稿