Tensorflow v2.*

Tensorflow v2.*
Tensorflowのサンプル試し(倒立振子問題07)

■途中の学習の追加と探索法の変更。今まで倒立振子問題のパラメータを変えて動かしてきたけど、今回は学習途中でサンプルを追加することとε-greedy法以外の探索法の試し。隠れ層(64,)、学習率0.0005、バッチ128、 […]

続きを読む
Tensorflow v2.*
Tensorflowのサンプル試し(倒立振子問題06)

■リプレイバッファを変えての試し。前回までは、隠れ層、学習率、バッチ、トレーニング数を変え、リプレイバッファの最大長、初期データ数を固定して動かしてきた。今回はリプレイバッファを変えての試し。隠れ層(64,)、学習率0. […]

続きを読む
Tensorflow v2.*
Tensorflowのサンプル試し(倒立振子問題05)

■条件を変えての続き2。前回のある程度あたりを付けた条件から、もう少し条件を絞って試す。今回は、隠れ層(64,)、(80,)、(96,)、学習率0.0005、0.0008、0.001で、バッチ128、リプレイバッファの最 […]

続きを読む
Tensorflow v2.*
Tensorflowのサンプル試し(倒立振子問題04)

■条件を変えての続き。前回に続いてパラメータを変えて試す。前回良好な結果として500回まで振子を倒さずに操作ができた。隠れ層、学習率、バッチをそれぞれ3つずつ変えて、リプレイバッファの最大長(2000)、初期データ収集ス […]

続きを読む
Tensorflow v2.*
Tensorflowのサンプル試し(倒立振子問題03)

■条件を変えて倒立振子問題を実施。前回取り上げたパラメータを変えて倒立振子問題を行ってみる。強化学習は試行のたびに結果が変わるので、どういった設定がいいものか?いくつか試した結果、下の設定で良好な結果が出るときがあった。 […]

続きを読む
Tensorflow v2.*
Tensorflowのサンプル試し(倒立振子問題02)

■倒立振子問題の続き。倒立振子のサンプルコードを生成して、この問題がどんな感じか見てみた。キーボードから右と左を入力して、棒が倒れないように操作する。CartPole-v1では、物理法則をシミュレートする形となっているよ […]

続きを読む
Tensorflow v2.*
Tensorflowのサンプル試し(倒立振子問題)

■ChatGPTでサンプルを生成して動作確認する。前回Tensorflow2.13の環境を整えたので、いくつかのテーマでChatGPTからサンプル生成して動作確認していきたい。なお、tf_agentsは強化学習のライブラ […]

続きを読む
Tensorflow v2.*
Tensorflowの再設定(2.13.0)

■環境の再設定。以前Tensorflow 2.2の設定を行ったけど改めてサンプルを実行したらエラーが出た。ChatGPTに頼って環境を再設定した。今回実行したサンプルコードは、初めに下のようにライブラリをインポートしてい […]

続きを読む
Tensorflow v2.*
Python(Tensorflow2.2の設定)

■機械学習まわりの勉強の再開。以前、TensorflowのVersion1.15で最小二乗法やMnistのサンプルの動作確認とかやったけど、現在Versionも上がり、いろいろと入門書も出ているので、改めてそのあたりの勉 […]

続きを読む