EnsekiTT Blog

EnsekiTTが書くブログです。

Reinforcement Learningのギャンブラー問題

Blog

強化学習って今まで触れずにきたなーってことで、 Reinforcement Learningに手を伸ばしました。

やべー肩とか下付き多くて怖い。とか思いつつ読み進めて、4章に居たり、プログラミングとな？となったので実際に書いてみた。

なんか、結果違う。ってなったのでググるといるじゃないですか、しかも、ゆるゆりの制作会社分類してた神が！！！ [強化学習で考えるギャンブラーの最適行動] http://kivantium.hateblo.jp/entry/2015/09/29/181954

更新に制限をつけて、「ある程度以上違いがないなら更新しない。」としている模様。導入したら綺麗な図が出てきたので満足した。（コードは反映済）

figure_1

figure_1-1

更に読み進めるぞ。

クリエイティブ・コモンズ・ライセンス

この作品はクリエイティブ・コモンズ表示 4.0 国際ライセンスの下に提供されています。