Powershell(オセロ012_5000回の回数は妥当?)

■一度5000回の試行について考えてみる。
今までに5つのロジックを試してきたけど、5000回での確認がどのくらい正確といえるものか。下のように、それぞれのロジックで勝率を出してきたけど、1度実行したのみ。そこで今回、ゲームの回数を変えながら複数実行し再現性などを見てみる。

ロジック勝率
1: 四隅優先78%
2: 一区画優先54%
3: 最多数65%
4: 途中(5回)まで最少数51%
5: 3手先の勝ち筋68%

ランダムvsランダムのゲームを50回、500回、5000回と行って勝率のぶれを確認した。結果が下のもの。

50回(勝率)500回(勝率)5000回(勝率)
1度目5450.449.3
2度目4850.249.14
3度目5249.650.9
4度目4650.250.92
5度目504849.38
6度目4848.850.36
7度目4646.649.5
8度目5243.250.1
9度目5250.649.68
10度目6046.250.04
平均50.848.3849.932
標準偏差4.23742.40820.6427
標準偏差*312.71227.22471.9281
平均±標準偏差*338.1 - 63.541.2 - 55.648.0 - 51.9

それぞれの勝率の平均と標準偏差を求めた。平均、標準偏差はExcelのAVERAGE、STDEV関数を使う。出てきた結果が正規分布に従うと仮定すると、平均±標準偏差*3の範囲に99%の結果が含まれることになる。つまり、50回を例にとると、50回のゲームを行った場合、その勝率は38.1%から63.5%の間に99%の確率で含まれる。逆に言えば、それだけ誤差がある。これが5000回になると、勝率48.0%から51.9%までとかなり幅は狭くなる。おそらく他のロジックでも範囲は同じくらいになるのではと思う。そう考えると、上の結果は±2%で考えるくらいが妥当なのかなー。

ちなみに10度で確認しているけど、この確認する回数を増やしたら、標準偏差は変わるものなのかな?
10度の結果(50回)に対して、さらに回数を増やして平均、標準偏差を求めてみた。結果が下。

10度30度50度
平均50.849.950.6
標準偏差4.23744.94065.8056
標準偏差*312.712214.821717.4167
平均±標準偏差*338.1 - 63.535.1 - 64.833.2 - 68.06

結果をみると、標準偏差が小さくなるといった傾向はなさそう。むしろ増えているような気もする。50回というゲームの回数が少ないので、ばらつきやすいのかな。

最後に、勝率が特に高かった1: 四隅優先のロジックを使って5000回のゲームをもう何度か行ってみる。±2%位におさまるかの確認。3度やった結果は、75.7%、76.7%、76.9%。もともとの78%は、77.52% (3876/5000)なので、一応±2%におさまっている。

勝率が高いものは±2%よりもはるかに高いので、5000回のゲームでの確認は妥当といえそう。