图灵奖得主Yann LeCun不看好强化学习：「我确实更喜欢 MPC」

人工智能学家 · 公众号 · AI · 2024-08-27 17:26

文章预览

来源：机器之心编辑：张倩、小舟五十多年前的理论还值得再研究一下？「相比于强化学习（RL），我确实更喜欢模型预测控制（MPC）。至少从 2016 年起，我就一直在强调这一点。强化学习在学习任何新任务时都需要进行极其大量的尝试。相比之下，模型预测控制是零样本的：如果你有一个良好的世界模型和一个良好的任务目标，模型预测控制就可以在不需要任何特定任务学习的情况下解决新任务。这就是规划的魔力。这并不意味着强化学习是无用的，但它的使用应该是最后的手段。」在最近发布的一个帖子中，Meta 首席人工智能科学家 Yann LeCun 发表了这样一番看法。一直以来，Yann LeCun 都是强化学习的批评者。他认为，强化学习这种方法需要大量的试验，非常低效。这和人类的学习方式大相径庭 —— 婴儿不是通过观察一百万个相同物体 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

机器之心 · 出人意料！DeepSeek-R1用的GRPO其实没必要？规模化强化学习训练用PPO就够了

6 小时前

爱可可-爱生活 · 高效树搜索（ETS）：优化推理时的计算扩展查看图片-20250221073838

10 小时前

黄建同学 · 刚刚成立的 Thinking Machine Lab 堪称Ope-20250220222322

19 小时前

新智元 · 微软20年精炼，全球首个拓扑量子芯片出炉！巴掌大芯片碾压全球超算

昨天

爱可可-爱生活 · 《爱可可微博热门分享(2.19)》爱可可微博热门分享(2.1-20250219224218

昨天

HACK之道 · 内推|2024年HW红蓝工程师招聘

9 月前

梅花易数周易风水命理师 · 猜猜寄送什么？取到五行火为红色。测:一份红色礼物。反馈:樱桃。 -20240606112542

8 月前

中国土地学会订阅号 · 欢迎下载~第34个全国土地日主题海报来了

8 月前

天然橡胶 · [橡胶人物]专注实验50年只为隔震橡胶（三）

6 月前

计算机视觉life · 当代版木牛流马？国外网友造出「会走路的桌子」，引百万人围观

5 月前