Python(強化学習の試し09_迷路04_結果の視覚化)

■通った場所を見えるようにする。
通った経路を縦横の位置情報で記録したので、そこからどこを何回通ったかカウントして視覚化してみた。まず、今回の迷路サンプルが下のもの。左上からスタートし、右下がゴールとなる。


11×11の迷路のすべての場所について何回通ったかカウントし、その数を2次元配列とする。その数を色情報にしてtkinterで表現する。tkinterのラベルの背景色は、#000000 (黒) ~ #ffffff (白)で指定できたので、通った回数の0 ~ 255(255以上の回数を通った場合は255にする)を対応させる。ただ、1の差は色合いからは分かりづらいので、結果を適当に何倍かさせて、見て分かるような濃度にした。
ランダムの結果の例は下のような感じ。
ランダム①


ランダム②


上の例を見ると、壁になっているところは当然通ることができないので(0回)、真っ黒になる(#000000)。また、色が白に近づくほど、より頻繁に通ったことを意味する。ランダム②では、左下がほぼ真っ白になっているので、この辺りでうろうろしていたことが分かる。
ちなみに、強化学習の100回目の結果は下のような感じ。真っすぐゴールへ向かっている。


強化学習でないものは、それぞれの結果が独立しているので、個々の結果を比較してもあまり意味はないだろうけど、強化学習のものは上の結果をつなぎ合わせれば経路が決まっていく様子が見れるかもしれない。ただ、そこからの発展は思いつかないので、このくらいにする。

今回の迷路サンプルは左上から右下へ向かう中でどの経路を通るべきか明らかなものだったので、次はそのあたりの判断が難しいものにする。

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です