こんにちは、えんせきです。
喉の調子は戻っていません。とりあえずビタミンを補給するために蜜柑を買ってきました。
今年初蜜柑です。甘みの当たりハズレが大きい
つまりなにしたの?
PPOで強化学習する時のベストプラクティスは良いとして、調整するためにはTensorBoardが読めないと難しい。
というわけでTensorBoardに何が表示されているのかまとめておく。
こんにちは、えんせきです。
熱は出なくなったのですがいかんせん喉のイガイガがとれません。
とても寒いからエアコンも消せないし加湿器かなにかを導入するか迷っています。
Best Practices when training with PPOを読んだので適用する時に都度英語を読まないで良いように日本語メモにした。
(日本語訳ではなく実装時に読み取れればいい程度なので情報は落ちる)
PPOはml-agentsにデフォルトで入っている強化学習手法
ensekitt.hatenablog.com
これの続き