|
【图灵奖得主Yoshua Bengio】提出强化学习新策略, 解决策略KL正则化漏洞问题。 深度强化学习实验室 · 公众号 · · 1 月前 · 访问文章快照 |
|
【NeurlPS2024分享】北航提出“结构信息原理指导的高效智能体探索”(末尾附开源代码) 深度强化学习实验室 · 公众号 · 科技自媒体 AI · 1 月前 · 访问文章快照 |
|
【清华北大腾讯等】联合综述OpenAI o1背后的自博(Self-Play)方法原理与技术细节 深度强化学习实验室 · 公众号 · 算法 科技自媒体 · 2 月前 · 访问文章快照 |
|
【重磅发布】OpenAI o1模型(草莓)问世,五级AGI再突破!使用「强化学习」再立大功。 深度强化学习实验室 · 公众号 · 科技自媒体 · 2 月前 · 访问文章快照 |
|
【RLC2024总结】关于 RL/ML 历史的讨论PPT—Andrew Barto(Sutton的老师,圣经书合著者) 深度强化学习实验室 · 公众号 · · 2 月前 · 访问文章快照 |
|
【清华大学】李升波教授团队总结“强化学习和模型预测控制的区别与联系” 深度强化学习实验室 · 公众号 · · 2 月前 · 访问文章快照 |
|
【顶会速递】RLC2024—128篇Accept论文汇总 深度强化学习实验室 · 公众号 · · 3 月前 · 访问文章快照 |
|
【重磅头条】Agent Q智能体发布,利用自我对弈和强化学习, 实现自我纠正和自主改进! 深度强化学习实验室 · 公众号 · 科技自媒体 科技媒体 · 3 月前 · 访问文章快照 |