logo
Loading...

什么是 Deep Deterministic Policy Gradient (DDPG) (Reinforcement Learning 强化学习) - 莫烦Python - 機器學習 Machine Learning 公開課 - Cupoy

今天我们会来说说强化学习中的一种actor critic 的提升方式 Deep Deterministic Policy Gradient (DDPG), DDPG 最大的优势就是能够在连续动作上更有...

今天我们会来说说强化学习中的一种actor critic 的提升方式 Deep Deterministic Policy Gradient (DDPG), DDPG 最大的优势就是能够在连续动作上更有效地学习.详细的文字教程: https://morvanzhou.github.io/tutorials/mach...