Tensorflow v2.*

2025-07-06

■途中の学習の追加と探索法の変更。今まで倒立振子問題のパラメータを変えて動かしてきたけど、今回は学習途中でサンプルを追加することとε-greedy法以外の探索法の試し。隠れ層(64,)、学習率0.0005、バッチ128、 […]

2025-06-29

■リプレイバッファを変えての試し。前回までは、隠れ層、学習率、バッチ、トレーニング数を変え、リプレイバッファの最大長、初期データ数を固定して動かしてきた。今回はリプレイバッファを変えての試し。隠れ層(64,)、学習率0. […]

2025-06-22

■条件を変えての続き２。前回のある程度あたりを付けた条件から、もう少し条件を絞って試す。今回は、隠れ層(64,)、(80,)、(96,)、学習率0.0005、0.0008、0.001で、バッチ128、リプレイバッファの最 […]

2025-06-15

■条件を変えての続き。前回に続いてパラメータを変えて試す。前回良好な結果として500回まで振子を倒さずに操作ができた。隠れ層、学習率、バッチをそれぞれ3つずつ変えて、リプレイバッファの最大長（2000）、初期データ収集ス […]

2025-06-08

■条件を変えて倒立振子問題を実施。前回取り上げたパラメータを変えて倒立振子問題を行ってみる。強化学習は試行のたびに結果が変わるので、どういった設定がいいものか？いくつか試した結果、下の設定で良好な結果が出るときがあった。 […]

2025-06-01

■倒立振子問題の続き。倒立振子のサンプルコードを生成して、この問題がどんな感じか見てみた。キーボードから右と左を入力して、棒が倒れないように操作する。CartPole-v1では、物理法則をシミュレートする形となっているよ […]

2025-05-25

■ChatGPTでサンプルを生成して動作確認する。前回Tensorflow2.13の環境を整えたので、いくつかのテーマでChatGPTからサンプル生成して動作確認していきたい。なお、tf_agentsは強化学習のライブラ […]

2025-05-18

■環境の再設定。以前Tensorflow 2.2の設定を行ったけど改めてサンプルを実行したらエラーが出た。ChatGPTに頼って環境を再設定した。今回実行したサンプルコードは、初めに下のようにライブラリをインポートしてい […]

2024-12-15

■機械学習まわりの勉強の再開。以前、TensorflowのVersion1.15で最小二乗法やMnistのサンプルの動作確認とかやったけど、現在Versionも上がり、いろいろと入門書も出ているので、改めてそのあたりの勉 […]