logo
Loading...

什么是 Actor Critic (Reinforcement Learning 强化学习) - 莫烦Python - 機器學習 Machine Learning 公開課 - Cupoy

今天我们会来说说强化学习中的一种结合体 Actor Critic (演员评判家), 它合并了 以值为基础 (比如 Q learning) 和 以动作概率为基础 (比如 Policy Gradients...

今天我们会来说说强化学习中的一种结合体 Actor Critic (演员评判家), 它合并了 以值为基础 (比如 Q learning) 和 以动作概率为基础 (比如 Policy Gradients) 两类强化学习算法.详细的文字教程: https://morvanzhou.github.io/tutorial...