強化学習勉強まとめ

Reinforcement Learning

主にOpenAIが公開している強化学習のプログラムであるSpinning upで勉強してみたメモのまとめ．その1 Introduction to RL Part1についてのメモその2 Introduction to RL Part2についてのメモその3 Introduction to RL Part3についてのメモその4 Algorith…

2018-12-25

OpenAIのSpinning Upで強化学習を勉強してみた　その7

Reinforcement Learning 実装

はじめにその7ということで今度はSoft Actor-Critic(SAC)をpytorchで実装する． Soft Actor-Critic SACはTD3とほぼ同時期にpublishされた論文．内容の肝としてはDDPGをベースにentropy regularizationを加えたというもの．簡単に言ってしまえば報酬に対して…