EnsekiTT Blog

EnsekiTTが書くブログです。

ml-agents学習中のTensorBoardを読み解く話

こんにちは、えんせきです。
喉の調子は戻っていません。とりあえずビタミンを補給するために蜜柑を買ってきました。
今年初蜜柑です。甘みの当たりハズレが大きい

つまりなにしたの?

PPOで強化学習する時のベストプラクティスは良いとして、調整するためにはTensorBoardが読めないと難しい。
というわけでTensorBoardに何が表示されているのかまとめておく。
f:id:ensekitt:20180128222616j:plain

続きを読む

PPOで強化学習する時のベストプラクティスの話

こんにちは、えんせきです。
熱は出なくなったのですがいかんせん喉のイガイガがとれません。
とても寒いからエアコンも消せないし加湿器かなにかを導入するか迷っています。

つまりなにしたの?

Best Practices when training with PPOを読んだので適用する時に都度英語を読まないで良いように日本語メモにした。
(日本語訳ではなく実装時に読み取れればいい程度なので情報は落ちる)
PPOはml-agentsにデフォルトで入っている強化学習手法

ensekitt.hatenablog.com
これの続き
f:id:ensekitt:20180128180202j:plain

続きを読む
クリエイティブ・コモンズ・ライセンス
この 作品 は クリエイティブ・コモンズ 表示 4.0 国際 ライセンスの下に提供されています。