强化学习-ddpg算法

这个算法应用最多 Deep Deterministic Policy Gradient(DDPG)，收集资料学习一下。

例子代码 https://keras.io/examples/rl/ddpg_pendulum/
算法解读 http://www.cs.sjsu.edu/faculty/pollett/masters/Semesters/Spring18/ujjawal/DDPG-Algorithm.pdf

强化学习

相关

DQN（Deep Q-learning）入门教程（一）之强化学习介绍

DQN（Deep Q-learning）入门教程（一）之强化学习介绍

强化学习系列（一）：强化学习简介

强化学习系列（一）：强化学习简介

强化学习系列（一）：强化学习简介

强化学习实战 | 自定义Gym环境之显示字符串

如何使用自对弈强化学习训练一个五子棋机器人Alpha Gobang Zero

强化学习入门知识与经典项目分析1.1

【强化学习】强化学习的笔记1——基本概念

【强化学习玩转超级马里奥】01-超级马里奥环境安装

强化学习读书笔记 - 10 - on-policy控制的近似方法

有监督学习、无监督学习以及强化学习

标签