Skip to content

强化学习

策略梯度、Q 学习、离线 RL、模仿学习与多智能体。

翻译状态

本页面的中文版本尚未提供。完整内容(《Reinforcement Learning》)请参阅 Reinforcement Learning(English)

如果你愿意协助翻译本页(保留链接、表格、参考文献格式),欢迎在 GitHub 仓库 提交 PR。

Released under the MIT License.