EnsekiTT Blog

EnsekiTTが書くブログです。

ml-agents学習中のTensorBoardを読み解く話

こんにちは、えんせきです。
喉の調子は戻っていません。とりあえずビタミンを補給するために蜜柑を買ってきました。
今年初蜜柑です。甘みの当たりハズレが大きい

つまりなにしたの?

PPOで強化学習する時のベストプラクティスは良いとして、調整するためにはTensorBoardが読めないと難しい。
というわけでTensorBoardに何が表示されているのかまとめておく。
f:id:ensekitt:20180128222616j:plain

続きを読む

PPOで強化学習する時のベストプラクティスの話

こんにちは、えんせきです。
熱は出なくなったのですがいかんせん喉のイガイガがとれません。
とても寒いからエアコンも消せないし加湿器かなにかを導入するか迷っています。

つまりなにしたの?

Best Practices when training with PPOを読んだので適用する時に都度英語を読まないで良いように日本語メモにした。
(日本語訳ではなく実装時に読み取れればいい程度なので情報は落ちる)
PPOはml-agentsにデフォルトで入っている強化学習手法

ensekitt.hatenablog.com
これの続き
f:id:ensekitt:20180128180202j:plain

続きを読む

Unityでインホイールモーター(?)のカートを作ってみた話

こんにちは、えんせきです。
風邪をひいたり治ったりしながらだましだまし仕事をしています。
みなさんも弱ってる時のインフルエンザには気をつけてくださいね。

つまりなにしたの?

強化学習(ml-agents)のAgentにするべく、カートを作ろうと思ったけど、美味い作り方がわからずはからずもインホイールモータになった。
f:id:ensekitt:20180126012338j:plain

続きを読む

プルプルしている倒立振子を安定させる話

こんにちは、えんせきです。
雪やばくないですか?思わず散歩に行きましたが雪強すぎて逃げ帰ってきました。

つまりなにしたの?

前回作成した倒立振子はプルプルしていた。これを綺麗に立たせるための施策を幾つかまとめる
この施策は前回紹介したモデルのベストプラクティスとまだ翻訳を載せていないPPOのベストプラクティスを反映したもの。

f:id:ensekitt:20180123004548j:plain

続きを読む

2018年1月19日−21日向けml-agentsのPPO.ipynbが動かない時の対処の話 ※追記

こんにちは、えんせきです。
ちょっと寒いところにずっといたら体調を崩してしまいました。よわい。
熱は下がらないけど眠気が全く来ないのでWindowsの環境を整えていました。

つまりなにしたの?

この週末で別の環境(Windows)にml-agentsを入れようと思ったらエラーが出たのでとりあえず対処した。
f:id:ensekitt:20180120001019j:plain

追記: 2018年1月25日
すごい人がなおしたっぽい。
github.com

続きを読む

AnacondaのCondaとPyenv virtualenvの対応をつけておく話

こんにちは、えんせきです。
友達が部屋に来ると部屋がきれいになっていいですよね。あと友達に何か説明すると頭が整理できていいですよね。
友達っていいですね。

つまりなにしたの?

普段はMacOSでpyenv virtualenvを使っている自分が、Windows+Anacondaを使わなくちゃいけなくなったからcondaと対応付をした。
f:id:ensekitt:20180119223305j:plain

*1

続きを読む

Pythonで定期的にスクリーンショットを撮る話

こんにちは、えんせきです。
スクショマニュアルを作っているといつもぼくはこのままで良いんだろうか!って気分になりますね。

つまりなにしたの?

今日はまさかのスクショマニュアル芸人になったので、Pythonで数秒おきにスクショを撮るようにしました。
f:id:ensekitt:20180117023625j:plain

続きを読む