2018-03-09から1日間の記事一覧

強化学習

多腕バンディット テスト - アナリティクス ヘルプ 強化学習その2on-policy, off-policy https://unit.aist.go.jp/diversity/ja/jst/teens/montecarlo.htmモンテカルロ法 強化学習入門 Part2 - TensorflowとKerasとOpenAI GymでPolicy Gradientを実装してみ…