注册
登录
专栏名称:
深度学习自然语言处理
一个从大三就接触NLP的小小NLPer,本公众号每天记录自己的一点一滴,每篇文章最后也有托福单词等新知识,学技术同时,也一点一滴积累额外的知识。期待与你在知识的殿堂与你相遇!
我也要提交微信公众号
今天看啥
微信公众号rss订阅, 微信rss, 稳定的RSS源
微信公众号RSS订阅方法
B站投稿RSS订阅方法
雪球动态RSS订阅方法
微博RSS订阅方法
微博搜索关键词订阅方法
豆瓣日记 RSS订阅方法
目录
相关文章推荐
上海证券报
·
重大资产置换!方案出炉
·
19 小时前
证券时报
·
苏炳添晒雷军送的小米SU7,雷军回应
·
3 天前
华泰睿思
·
华泰2025年展望 | ...
·
4 天前
今天看啥
›
专栏
›
深度学习自然语言处理
Yann LeCun不看好强化学习:「我确实更喜欢 MPC」
深度学习自然语言处理
·
公众号
· · 2024-08-27 17:00
文章预览
机器之心报道 编辑:张倩、小舟 五十多年前的理论还值得再研究一下? 「相比于强化学习(RL),我确实更喜欢模型预测控制(MPC)。至少从 2016 年起,我就一直在强调这一点。强化学习在学习任何新任务时都需要进行极其大量的尝试。相比之下,模型预测控制是零样本的:如果你有一个良好的世界模型和一个良好的任务目标,模型预测控制就可以在不需要任何特定任务学习的情况下解决新任务。这就是规划的魔力。这并不意味着强化学习是无用的,但它的使用应该是最后的手段。」 在最近发布的一个帖子中,Meta 首席人工智能科学家 Yann LeCun 发表了这样一番看法。 一直以来,Yann LeCun 都是强化学习的批评者。他认为,强化学习这种方法需要大量的试验,非常低效。这和人类的学习方式大相径庭 —— 婴儿不是通过观察一百万个相同物体的样 ………………………………
原文地址:
访问原文地址
快照地址:
访问文章快照
总结与预览地址:
访问总结与预览
分享到微博
推荐文章
上海证券报
·
重大资产置换!方案出炉
19 小时前
证券时报
·
苏炳添晒雷军送的小米SU7,雷军回应
3 天前
华泰睿思
·
华泰2025年展望 | 食品饮料:从场景修复看板块投资机会
4 天前
茶狐看世界
·
中国哪个省,痔疮比例最高?
4 月前
催化开天地
·
组会破防了!导师问我的单原子球差电镜为什么模糊不清、分析不了······
4 月前
民商事裁判规则
·
七大专栏 | 精选法律实务好课 (持续更新)
4 月前
柠檬心理FM
·
当初吸引你的,可能也是最后伤害你的
3 月前
BMWsky宝马会
·
【今日问马】E93停放2-3天不开,打火就提示蓄电池严重漏电...
2 月前