强化学习-ddpg算法
这个算法应用最多 Deep Deterministic Policy Gradient(DDPG), 收集资料学习一下。
- 例子代码 https://keras.io/examples/rl/ddpg_pendulum/
- 算法解读 http://www.cs.sjsu.edu/faculty/pollett/masters/Semesters/Spring18/ujjawal/DDPG-Algorithm.pdf
这个算法应用最多 Deep Deterministic Policy Gradient(DDPG), 收集资料学习一下。