Tech Tips

ホーム
機械学習・AI, 要素技術
TF-Agents で独自の環境を利用する方法

1SEP2021

機械学習・AI
2789 view

TF-Agents で独自の環境を利用する方法

cartpole-env

TF-Agents という強化学習のライブラリがありますが、自分でエージェントに学習させたい環境を定義する際に、ドキュメントや記事がほとんど見つからずに苦労したので、備忘録として残しておきます。

以下の RockScissorsPaperEnv が独自の環境のクラスになります。簡単なジャンケンの環境で、100 回勝負で相手は常にグーを出します。

最低限、action_spec メソッドでアクションの種類、observation_spec メソッドで観測できる状態の定義を返し、_step メソッドで 1 ステップ進める処理 (終了判定、報酬計算含む）、_reset メソッドで環境のリセット処理を定義すれば良さそうです。

Amazon Lex V2 で入力させる内容を分岐する方法前の記事

ソフトウェアシステムアーキテクチャ構築の原理第2版を読みました次の記事

機械学習・AIの最近記事

関連記事

13JUL2013

[Haskell]画像処理　水平方向のエッジ
8FEB2025

LangChain Agents を使用して自動的に機械学習…
3JUL2013

[R]k-meansでirisをクラスタリングしてみる
12DEC2016

[OpenCV][Ruby]Webページのデザイン崩れ確認の…
18JAN2015

[Java][Webカメラ][背景差分]Webカメラで撮って…
11JUL2013

[Haskell]反転画像の生成

Copyright © zuqqhi2 Tech Memo