Yann LeCun不看好强化学习：「我确实更喜欢 MPC」

机器学习研究组订阅 · 公众号 · AI · 2024-08-26 20:46

文章预览

五十多年前的理论还值得再研究一下？「相比于强化学习（RL），我确实更喜欢模型预测控制（MPC）。至少从 2016 年起，我就一直在强调这一点。强化学习在学习任何新任务时都需要进行极其大量的尝试。相比之下，模型预测控制是零样本的：如果你有一个良好的世界模型和一个良好的任务目标，模型预测控制就可以在不需要任何特定任务学习的情况下解决新任务。这就是规划的魔力。这并不意味着强化学习是无用的，但它的使用应该是最后的手段。」在最近发布的一个帖子中，Meta 首席人工智能科学家 Yann LeCun 发表了这样一番看法。一直以来，Yann LeCun 都是强化学习的批评者。他认为，强化学习这种方法需要大量的试验，非常低效。这和人类的学习方式大相径庭 —— 婴儿不是通过观察一百万个相同物体的样本来识别物体，或者尝试危险的东 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

爱可可-爱生活 · 晚安～ #晚安# -20241115225229

6 天前

爱可可-爱生活 · 【Thinking Claude：让Claude思考再回答，旨在-20241115202312

6 天前

爱可可-爱生活 · 【SLAM手册：一本由众多专家共同编写的指南，涵盖SLAM（同时-20241115205915

6 天前

爱可可-爱生活 · 【FLAME头追踪器：一款用于单图像重建和视频追踪的头部追踪工具-20241115211219

6 天前

宝玉xp · 这个我觉得还好，重点在于得经常用，学编程最大的障碍是遇到问题老是-20241115123358

6 天前