注册
登录
专栏名称:
人工智能学家
致力成为权威的人工智能科技媒体和前沿科技研究机构
我也要提交微信公众号
今天看啥
微信公众号rss订阅, 微信rss, 稳定的RSS源
微信公众号RSS订阅方法
B站投稿RSS订阅方法
雪球动态RSS订阅方法
微博RSS订阅方法
微博搜索关键词订阅方法
豆瓣日记 RSS订阅方法
目录
相关文章推荐
爱可可-爱生活
·
【语言模型安全研究:汇集了关于大型语言模型有 ...
·
3 天前
量子位
·
陶哲轩推荐:2高中生发现勾股定理新证明,论文 ...
·
3 天前
爱可可-爱生活
·
【mdx - ...
·
5 天前
宝玉xp
·
//@程序员邹欣:“无需技能”(Nonski ...
·
5 天前
爱可可-爱生活
·
[CL] A Survey of ...
·
5 天前
今天看啥
›
专栏
›
人工智能学家
图灵奖得主Yann LeCun不看好强化学习:「我确实更喜欢 MPC」
人工智能学家
·
公众号
·
AI
· 2024-08-27 17:26
文章预览
来源:机器之心 编辑:张倩、小舟 五十多年前的理论还值得再研究一下? 「相比于强化学习(RL),我确实更喜欢模型预测控制(MPC)。至少从 2016 年起,我就一直在强调这一点。强化学习在学习任何新任务时都需要进行极其大量的尝试。相比之下,模型预测控制是零样本的:如果你有一个良好的世界模型和一个良好的任务目标,模型预测控制就可以在不需要任何特定任务学习的情况下解决新任务。这就是规划的魔力。这并不意味着强化学习是无用的,但它的使用应该是最后的手段。」 在最近发布的一个帖子中,Meta 首席人工智能科学家 Yann LeCun 发表了这样一番看法。 一直以来,Yann LeCun 都是强化学习的批评者。他认为,强化学习这种方法需要大量的试验,非常低效。这和人类的学习方式大相径庭 —— 婴儿不是通过观察一百万个相同物体 ………………………………
原文地址:
访问原文地址
快照地址:
访问文章快照
总结与预览地址:
访问总结与预览
分享到微博
推荐文章
爱可可-爱生活
·
【语言模型安全研究:汇集了关于大型语言模型有害微调问题的研究论文-20241030135705
3 天前
量子位
·
陶哲轩推荐:2高中生发现勾股定理新证明,论文已发《美国数学月刊》
3 天前
爱可可-爱生活
·
【mdx - 执行Markdown中的代码块,让你能直接在Mar-20241028212913
5 天前
宝玉xp
·
//@程序员邹欣:“无需技能”(Nonskilling)的浪潮-20241028130439
5 天前
爱可可-爱生活
·
[CL] A Survey of Conversational -20241028054420
5 天前
张君学习圈
·
支撑一个人最终做出勇敢选择的原因
3 月前
筑龙电气
·
领导一直和施工方说TN-s系统配电箱要接等电位
2 月前