强化学习
策略梯度、Q 学习、离线 RL、模仿学习与多智能体。
翻译状态
本页面的中文版本尚未提供。完整内容(《Reinforcement Learning》)请参阅 Reinforcement Learning(English)。
如果你愿意协助翻译本页(保留链接、表格、参考文献格式),欢迎在 GitHub 仓库 提交 PR。
策略梯度、Q 学习、离线 RL、模仿学习与多智能体。
本页面的中文版本尚未提供。完整内容(《Reinforcement Learning》)请参阅 Reinforcement Learning(English)。
如果你愿意协助翻译本页(保留链接、表格、参考文献格式),欢迎在 GitHub 仓库 提交 PR。