Tensorflow v2.*
Tensorflowの再設定(2.13.0)新着!!

■環境の再設定。以前Tensorflow 2.2の設定を行ったけど改めてサンプルを実行したらエラーが出た。ChatGPTに頼って環境を再設定した。今回実行したサンプルコードは、初めに下のようにライブラリをインポートしてい […]

続きを読む
その他
スマホでATMから現金引き出し

■出先で現金が必要になった話。 最近旅行に行った際に、手持ちの現金が3000円程度しか無いことに出発してから気づいた。世の中キャッシュレスが進んでいるので、すぐに困ることもないだろう。それに、クレジットカードは持っていた […]

続きを読む
Python
Python(強化学習の試し16_迷路10_迷路サンプル3得点50の経路)

■最大の得点(50)を取るような設計ができるかの試し。 下のルートのような得点50になる経路を導けるか検討した。 ChatGPTと何度かやり取りをして最終的に下の設定にした。 ・学習率:0.3 ・割引率:0.99 ・探索 […]

続きを読む
Python
Python(強化学習の試し15_迷路09_迷路サンプル3の試し3)

■報酬を変えての試し。現在は下の迷路サンプルを使っているけど、 0 がつくところを報酬1、2を報酬10、3を報酬20(ゴールとしてここに着いたら終了)としている。移動は上下左右を選択できるので、壁を選択することもできる( […]

続きを読む
Python
Python(強化学習の試し14_迷路09_迷路サンプル3の試し2)

■学習率、割引率を変えての試し。前回は、学習率 α = 0.01、割引率 γ = 0.2で10度試した。学習率や割引率を変えて挙動を見てみる。 まず下のように割引率 γ を変えて実施。学習率 α = 0.01割引率 γ […]

続きを読む
Python
Python(強化学習の試し13_迷路08_迷路サンプル3_強化学習)

■普通の強化学習を試す。前回のコードから、報酬部分(2)を下のように置いて、強化学習を試した。左上をスタートとして、右下をゴールにするため、ぱっとみ右上か左下を経由してゴールに向かうのが最短でそれなりに報酬も得られる。 […]

続きを読む
Python
Python(強化学習の試し12_迷路07_迷路サンプル3)

■経路選択を調べるためのサンプル。最適なルートがぱっとみ分からないような、少し複雑な迷路サンプルを使って強化学習を見ようとしたけど、処理に時間がかかりすぎる。そのため、迷路のサンプルをCUIにする。 とりあえず正常に動く […]

続きを読む
Python
ChatGPTの試し(オセロ)

■ChatGPTを試してみる。以前から生成AIについて興味があったので、強化学習の勉強の箸休めとしてどんなものか試してみた。無料版は使えるそうなので、それでオセロのコードを出力させてみた。他にPlus、Pro(現時点でU […]

続きを読む
Python
Python(強化学習の試し11_迷路06_強化学習)

■複雑なサンプルで強化学習を試した結果。前回の迷路のサンプル(下のもの)で何度か強化学習を試した。通ることができるマスは報酬1、黄色マスは報酬10、右下のゴールは報酬20にしている。 100回学習したときの最後の結果が下 […]

続きを読む
Python
Python(強化学習の試し10_迷路05_迷路サンプル2)

■少し複雑な迷路のサンプルで試す。前回の迷路のサンプルでは、最適化したルートが明らかだったので、今回は下のようなサンプルで強化学習を試す。黄色マスは全部で13で、一見してどういったルートが最適か分からない。 このサンプル […]

続きを読む
Python
Python(強化学習の試し09_迷路04_結果の視覚化)

■通った場所を見えるようにする。通った経路を縦横の位置情報で記録したので、そこからどこを何回通ったかカウントして視覚化してみた。まず、今回の迷路サンプルが下のもの。左上からスタートし、右下がゴールとなる。 11×11の迷 […]

続きを読む
Python
Python(2次元配列の初期化)

■2次元配列の初期化の復習。今まで迷路サンプルの試しで通った道の記録を取ってきたけど、その情報は下のように [縦の位置、横の位置]として取得している。 1 : [[1, 2], [1, 3], [1, 2], [1, 1 […]

続きを読む