Tech Tips

  1. 機械学習・AI
  2. 2613 view

TF-Agents で独自の環境を利用する方法

cartpole-env
TF-Agents という強化学習のライブラリがありますが、自分でエージェントに学習させたい環境を定義する際に、ドキュメントや記事がほとんど見つからずに苦労したので、備忘録として残しておきます。 以下の RockScissorsPaperEnv が独自の環境のクラスになります。簡単なジャンケンの環境で、100 回勝負で相手は常にグーを出します。

最低限、action_spec メソッドでアクションの種類、observation_spec メソッドで観測できる状態の定義を返し、_step メソッドで 1 ステップ進める処理 (終了判定、報酬計算含む)、_reset メソッドで環境のリセット処理を定義すれば良さそうです。

機械学習・AIの最近記事

  1. LangChain Agents を使用して自動的に機械学習モデルのパラメータをチューニン…

  2. TF-Agents で独自の環境を利用する方法

  3. Tensorboardを使ってニューラルネットワークと学習の状況を可視化する

  4. [機械学習]各種Pythonライブラリ入りの実験用Dockerイメージを作った

  5. [機械学習]機械学習の種類

関連記事

PAGE TOP