2025年
Python(強化学習の試し05_Rewardの条件の変更)新着!!
2025-01-19
■途中でRewardの条件を変える。引き続き下の条件を使う。・試行は100回。これを1エピソードとして、400エピソード実行。・過去の試行3回分から強化学習。今までは、試行の100回、エピソードの400回でずっと同じ条件 […]
Python(強化学習の試し04_学習率α、割引率γを変える)
2025-01-12
■学習率、割引率を変えて試す。引き続き、過去の試行3回分をもとに強化学習をさせてみる。条件は次のように変える。・試行は100回。これを1エピソードとして、400エピソード実行する。エピソードが進むにつれてQ値は更新されて […]
Python(強化学習の試し03_過去の試行3つ分で学習2)
2025-01-05
■学習するコードの改善。何となく学習されているようだけど結果が芳しくなかったので、学習するコードを改善する。条件は下のもの。・ボタン(0と1)がある状態で、どちらかを押す想定。・0を押した後に1を押すと報酬として1が追加 […]
2025/01/01 良いお年を
2025-01-01
昨年を振り返ると、ほぼ週一のペースで投稿できました。内容としては、Python(QRコード)、Android Java(NFC通信、Bluetooth)、Visual basic (オセロ)、バッチ(ファイルURLチェッ […]