つまりなにしたの ブロック崩しなどで一世を風靡したDeep Q NetworkをChainerで実装して、OpenAIの環境で育てた。 youtu.be 基本的な強化学習の流れ ゲームそのものをEnvironment ゲームで言うプレイヤーをAgent プレイヤーの操作をAction プレイヤーはプレ…
引用をストックしました
引用するにはまずログインしてください
引用をストックできませんでした。再度お試しください
限定公開記事のため引用できません。