EnsekiTT Blog

EnsekiTTが書くブログです。

Unity

【悲報】ゴールに至らず。差動2駆カートを強化学習で走らせた話

つまりなにしたの? 先日のカートを差動二輪駆動カートにして一本橋を渡りきれるかチャレンジしました。 失敗しました。

ml-agents学習中のTensorBoardを読み解く話

つまりなにしたの? PPOで強化学習する時のベストプラクティスは良いとして、調整するためにはTensorBoardが読めないと難しい。 というわけでTensorBoardに何が表示されているのかまとめておく。

PPOで強化学習する時のベストプラクティスの話

Best Practices when training with PPOを読んだので適用する時に都度英語を読まないで良いように日本語メモにした。 (日本語訳ではなく実装時に読み取れればいい程度なので情報は落ちる) PPOはml-agentsにデフォルトで入っている強化学習手法

Unityでインホイールモーター(?)のカートを作ってみた話

つまりなにしたの? 強化学習(ml-agents)のAgentにするべく、カートを作ろうと思ったけど、美味い作り方がわからずはからずもインホイールモータになった。

プルプルしている倒立振子を安定させる話

つまりなにしたの? 前回作成した倒立振子はプルプルしていた。これを綺麗に立たせるための施策を幾つかまとめる この施策は前回紹介したモデルのベストプラクティスとまだ翻訳を載せていないPPOのベストプラクティスを反映したもの。

強化学習をする時のベストプラクティスの話

つまりなにしたの? Unityのml-agentsのドキュメントから、Environment Design Best Practicesを読んだので適用する時に都度英語を読まないで良いように日本語メモにした。

Unityで強化学習するけど脱サンプルするためにサンプル以下の物を作った話

つまりなにしたの? 前回はUnityが用意してくれたサンプルを動かしたけど、今回はしょぼくなってもいいから自分のシーンで強化学習してみた。

Unityで強化学習していたAgentのソースコードを読む話

つまりなにしたの? 先日、球をのせ続けることが得意になったAgentが何をやっているのか読みといてみた。 Assets/ML-Agents/Examples/3DBall/Scripts/Ball3DAgent.csが今日のターゲット

Unityで強化学習した友達が上手になってたので報告する話

* つまりなにしたの? 前回Machine Learning Agentsに学習をさせた話の続きを紹介する。TFShapePluginをインポートしてもろもろ設定する。学習したモデルをUnityで読み込む。

一人っ子だからUnityで強化学習して一緒にゲームする友達を作る話

つまりなにしたの?UnityのMachine Learning Agentsで遊んだ。Unity Machine Learning Agentsってなに?強化学習は、褒められた方式を覚えてどんどんスコアを良くすることができる機械学習の一つ。エージェントになる。 Unity Machine Learning Agentsは環境…