ここから本文です

1次元ランダムウォークに関する質問です。

iwt********さん

2019/6/2618:00:03

1次元ランダムウォークに関する質問です。

プレイヤーの持ち金が20円、胴元の持ち金が80円で始まるギャンブルを考えます。各試行ごとに、確率p(0<p<1)でプレイヤーが勝ち、胴元から1円を奪い取れます。反対に1-pの確率で胴元がプレイヤーから1円を奪い取れます。これをプレイヤーか胴元が破産(持ち金が0円)するまで続けます。プレイヤーが破産する確率はいくつでしょうか。

補足追記:出来れば、プレイヤーが破産するときの試行回数の期待値も求めて頂けると助かります。

閲覧数:
55
回答数:
1
お礼:
50枚

違反報告

ベストアンサーに選ばれた回答

def********さん

2019/7/312:07:57

(1)
N=20+80=100, q=1-p とする。
また、持ち金がk円のとき破産する確率をR(k)(ただし0≦k≦N)とする。
このとき、R(0)=1, R(N)=0 …①

また、1≦k≦N-1 のとき、1回目の勝負で勝てば確率R(k+1)で破産し、負ければ確率R(k-1)で破産するから、
R(k)=qR(k-1)+pR(k+1) …②

i) p=q のとき、p=1-p ∴p=1/2
漸化式②から、R(k)=(1/2)R(k-1)+(1/2)R(k+1)
∴R(k+1)-2R(k)+R(k-1)=0 …③
R(k+1)-R(k)=R(k)-R(k-1)=・・・=R(1)-R(0)=R(1)-1
∴R(k)=R(0)+k{R(1)-1}=1+k{R(1)-1}
①から、R(N)=1+N{R(1)-1}=0 ∴R(1)-1=-1/N
∴R(k)=1-(k/N)

ii) p≠q のとき、
漸化式②から、pR(k+1)-R(k)+qR(k-1)=0
pR(k+1)-R(k)+(1-p)R(k-1)=0 …④
特性方程式は、
pt^2-t+1-p=0 ⇔ (t-1){pt-(1-p)}=0 ∴t=1, (1-p)/p
(1-p)/p=α とおくと、漸化式④から、
(k+1)-R(k)=α{R(k)-R(k-1)}
∴R(k+1)-R(k)=α^k・{R(1)-R(0)}=α^k・{R(1)-1}
∴R(k)=R(0)+(1-α^k)/(1-α)・{R(1)-1}=1+(1-α^k)/(1-α)・{R(1)-1}

R(N)=0 だから、R(N)=1+(1-α^N)/(1-α)・{R(1)-1}=0
∴R(1)-1=-(1-α)/(1-α^N)
∴R(k)=1-{(1-α^k)/(1-α)}{(1-α)/(1-α^N)}=1-{(1-α^k)/(1-α^N)}
=(α^k-α^N)/(1-α^N)
={((1-p)/p)^k-((1-p)/p)^N}/{1-((1-p)/p)^N}
={p^(N-k)・(1-p)^k-(1-p)^N}/{p^N-(1-p)^N}

i),ii) から、プレイヤーが破産する確率は、
p=1/2 のとき、R(20)=1-(20/100)=4/5
p≠1/2 のとき、R(20)={p^80-(1-p)^100}/{p^100-(1-p)^100}


(2)
持ち金がk円ある状態から、ゲームが終了するまでの平均勝負数をG(k)とする。G(k)は1≦k≦N-1において、1回目の勝負で勝てばその後の平均勝負数はG(k+1)で、負ければその後の平均勝負数はG(k-1) となる。最初の1回目で1つの勝負を行っているから、G(k)は、次の漸化式を満たす。
G(k)=1+pG(k+1)+qG(k-1) …⑤
また、G(0)=G(N)=0

i) p=q のとき、p=q=1/2
漸化式⑤から、G(k+1)-2G(k)+G(k-1)+2=0
G(k)=A(k)+ak^2 (aは定数)とおいて代入すると、
A(k+1)+a(k+1)^2-2A(k)-2ak^2+A(k-1)+a(k-1)^2+2=0
{A(k+1)-2A(k)+A(k-1)}+2(a+1)=0
ここで、a=-1とおくと、A(k)は、次の条件を満たす。
A(k+1)-2A(k)+A(k-1)=0 …⑥
A(0)=G(0)=0, A(N)=G(N)+N^2=N^2 …⑦

⑥の漸化式を変形して、
A(k+1)-A(k)=A(k)-A(k-1)=・・・=A(1)-A(0)=A(1) (∵⑦)
∴A(k)=A(0)+kA(1)=kA(1)
⑦から、k=Nのとき、A(N)=NA(1)=N^2 ∴A(1)=N
∴A(k)=kN
∴G(k)=A(k)-k^2=kN-k^2=k(N-k)


ii) p≠q のとき、
B(k)=G(k)+bk (bは定数)とおいて、⑤に代入すると、
B(k)-bk=1+p{B(k+1)-b(k+1)}+q{B(k-1)-b(k-1)}
pB(k+1)-B(k)+qB(k-1)+1-(p-q)b=0
よって、1-(p-q)b=0を満たすようにbをとると、B(k)は、次の関係式を満たす。
pB(k+1)-B(k)+qB(k-1)=0, b=1/(p-q) …⑧
B(0)=G(0)=0, B(N)=G(N)+bN=N/(p-q) …⑨

⑧の漸化式の特性方程式から、
pt^2-t+(1-p)={pt-(1-p)}(t-1)=0 ∴t=(1-p)/p, 1=q/p, 1

⑧を変形して、
B(k+1)-(q/p)B(k)=A(k)-(q/p)B(k-1)=・・・=B(1)-(q/p)B(0)=B(1) (∵⑨)
B(k+1)-B(k)=(q/p){B(k)-B(k-1)}

B(k+1)-(q/p)B(k)=B(1)
B(k+1)-B(k)=(q/p)^k・{B(1)-B(0)}=(q/p)^k・B(1)
辺々ひいて、
{1-(q/p)}B(k)={1-(q/p)^k}B(1)

⑨から、k=N のとき、{1-(q/p)}N/(p-q)={1-(q/p)^N}B(1)
∴B(1)=(N/p)/{1-(q/p)^N}
∴B(k)={1-(q/p)^k}・(N/p)/{1-(q/p)^N}/{1-(q/p)}
={N/(p-q)}{1-(q/p)^k}/{1-(q/p)^N}
∴G(k)=B(k)-bk={N/(p-q)}{1-(q/p)^k}/{1-(q/p)^N}-{k/(p-q)}
={N/(2p-1)}{1-((1-p)/p)^k}/{1-((1-p)/p)^N}-{k/(2p-1)}


i),ii) から、プレイヤーが破産するときの試行回数の期待値は、
p=1/2 のとき、G(20)=20(100-20)=1600
p≠1/2 のとき、G(20)={100/(2p-1)}{1-((1-p)/p)^20}/{1-((1-p)/p)^100}-{20/(2p-1)}


=============================
1次元ランダムウォークに関する質問です。
プレイヤーの持ち金が20円、胴元の持ち金が80円で始まるギャンブルを考えます。各試行ごとに、確率p(0<p<1)でプレイヤーが勝ち、胴元から1円を奪い取れます。反対に1-pの確率で胴元がプレイヤーから1円を奪い取れます。これをプレイヤーか胴元が破産(持ち金が0円)するまで続けます。プレイヤーが破産する確率はいくつでしょうか。
補足
追記:出来れば、プレイヤーが破産するときの試行回数の期待値も求めて頂けると助かります。
=============================
iwted58761さん(2019/6/19 17:07:57)への回答

この回答は投票によってベストアンサーに選ばれました!

この質問につけられたタグ

みんなで作る知恵袋 悩みや疑問、なんでも気軽にきいちゃおう!

Q&Aをキーワードで検索:

Yahoo! JAPANは、回答に記載された内容の信ぴょう性、正確性を保証しておりません。
お客様自身の責任と判断で、ご利用ください。
本文はここまでです このページの先頭へ

「追加する」ボタンを押してください。

閉じる

※知恵コレクションに追加された質問は選択されたID/ニックネームのMy知恵袋で確認できます。

不適切な投稿でないことを報告しました。

閉じる