Powershell(オセロ012_5000回の回数は妥当?)
■一度5000回の試行について考えてみる。
今までに5つのロジックを試してきたけど、5000回での確認がどのくらい正確といえるものか。下のように、それぞれのロジックで勝率を出してきたけど、1度実行したのみ。そこで今回、ゲームの回数を変えながら複数実行し再現性などを見てみる。
ロジック | 勝率 |
1: 四隅優先 | 78% |
2: 一区画優先 | 54% |
3: 最多数 | 65% |
4: 途中(5回)まで最少数 | 51% |
5: 3手先の勝ち筋 | 68% |
ランダムvsランダムのゲームを50回、500回、5000回と行って勝率のぶれを確認した。結果が下のもの。
50回(勝率) | 500回(勝率) | 5000回(勝率) | |
1度目 | 54 | 50.4 | 49.3 |
2度目 | 48 | 50.2 | 49.14 |
3度目 | 52 | 49.6 | 50.9 |
4度目 | 46 | 50.2 | 50.92 |
5度目 | 50 | 48 | 49.38 |
6度目 | 48 | 48.8 | 50.36 |
7度目 | 46 | 46.6 | 49.5 |
8度目 | 52 | 43.2 | 50.1 |
9度目 | 52 | 50.6 | 49.68 |
10度目 | 60 | 46.2 | 50.04 |
平均 | 50.8 | 48.38 | 49.932 |
標準偏差 | 4.2374 | 2.4082 | 0.6427 |
標準偏差*3 | 12.7122 | 7.2247 | 1.9281 |
平均±標準偏差*3 | 38.1 - 63.5 | 41.2 - 55.6 | 48.0 - 51.9 |
それぞれの勝率の平均と標準偏差を求めた。平均、標準偏差はExcelのAVERAGE、STDEV関数を使う。出てきた結果が正規分布に従うと仮定すると、平均±標準偏差*3の範囲に99%の結果が含まれることになる。つまり、50回を例にとると、50回のゲームを行った場合、その勝率は38.1%から63.5%の間に99%の確率で含まれる。逆に言えば、それだけ誤差がある。これが5000回になると、勝率48.0%から51.9%までとかなり幅は狭くなる。おそらく他のロジックでも範囲は同じくらいになるのではと思う。そう考えると、上の結果は±2%で考えるくらいが妥当なのかなー。
ちなみに10度で確認しているけど、この確認する回数を増やしたら、標準偏差は変わるものなのかな?
10度の結果(50回)に対して、さらに回数を増やして平均、標準偏差を求めてみた。結果が下。
10度 | 30度 | 50度 | |
平均 | 50.8 | 49.9 | 50.6 |
標準偏差 | 4.2374 | 4.9406 | 5.8056 |
標準偏差*3 | 12.7122 | 14.8217 | 17.4167 |
平均±標準偏差*3 | 38.1 - 63.5 | 35.1 - 64.8 | 33.2 - 68.06 |
結果をみると、標準偏差が小さくなるといった傾向はなさそう。むしろ増えているような気もする。50回というゲームの回数が少ないので、ばらつきやすいのかな。
最後に、勝率が特に高かった1: 四隅優先のロジックを使って5000回のゲームをもう何度か行ってみる。±2%位におさまるかの確認。3度やった結果は、75.7%、76.7%、76.9%。もともとの78%は、77.52% (3876/5000)なので、一応±2%におさまっている。
勝率が高いものは±2%よりもはるかに高いので、5000回のゲームでの確認は妥当といえそう。