注册
登录
专栏名称:
AI有道
一个有情怀、有良心的公众号。AI领域机器学习、深度学习等知识集中营,干货满满。期待与你共同进步!
我也要提交微信公众号
今天看啥
微信公众号rss订阅, 微信rss, 稳定的RSS源
微信公众号RSS订阅方法
B站投稿RSS订阅方法
雪球动态RSS订阅方法
微博RSS订阅方法
微博搜索关键词订阅方法
豆瓣日记 RSS订阅方法
目录
相关文章推荐
墨香中华
·
飘进唐诗宋词里的小雪
·
昨天
APPSO
·
农夫山泉钟睒睒炮轰张一鸣,要求道歉/马斯克: ...
·
2 天前
APPSO
·
初代星舰最后一飞!首次在太空点燃猛禽发动机, ...
·
3 天前
墨香中华
·
儿子因公殉职,2年后,母亲在商场看到熟悉的背 ...
·
4 天前
小众软件
·
好评如潮的经典之作!《半条命2》20周年庆限 ...
·
5 天前
今天看啥
›
专栏
›
AI有道
Ilya 预言错了!华人 Nature 一作给 RLHF「判死刑」,全球大模型都不可靠
AI有道
·
公众号
· · 2024-09-30 10:55
文章预览
转自 | 新智元 编辑 | 编辑部 HXY 【导读】 Ilya两年前观点,竟被Nature论文反驳了!来自剑桥大学等团队最新研究发现,所有大模型并不可靠,包括最强o1。 2022年,AI大牛Ilya Sutskever曾预测:「随着时间推移,人类预期和AI实际表现差异可能会缩小」。 然而,一篇最新发表在Nature上的研究表明,事实并非如此! 世界上所有的大模型,甚至指令微调后的LLM,竟是一个「巨大的草台班子」。 论文地址:https://www.nature.com/articles/s41586-024-07930-y 来自VRAIN、剑桥等机构研究人员对o1-preview等领先的LLM开启了全方位评测,结果发现: - LLM & 人类无法保持一致:人类认为复杂的任务,LLM轻易解决;而对人类小菜一碟的问题,LLM却失败了。 - LLM不会「回避」复杂任务,而是强撑面子费力思考半天,最终仍旧答错。 - 提示工程,无法挽救LLM的不可靠。 且看CoT「推理王者」 ………………………………
原文地址:
访问原文地址
快照地址:
访问文章快照
总结与预览地址:
访问总结与预览
分享到微博
推荐文章
墨香中华
·
飘进唐诗宋词里的小雪
昨天
APPSO
·
农夫山泉钟睒睒炮轰张一鸣,要求道歉/马斯克:AGI最晚2026年实现,人形机器人超100亿/曝华为鸿蒙智行销售车型明年翻倍
2 天前
APPSO
·
初代星舰最后一飞!首次在太空点燃猛禽发动机,马斯克、特朗普现场观看
3 天前
墨香中华
·
儿子因公殉职,2年后,母亲在商场看到熟悉的背影,拽住对方痛哭:儿子,是你吗?妈妈好想你!
4 天前
小众软件
·
好评如潮的经典之作!《半条命2》20周年庆限免,11月18日前限时领取|不用安装也能领
5 天前
西子湖畔
·
惠州新增2个新盘和2个商业综合体!
4 月前
医职园
·
【非全日制在职研究生】报名已开启!扫码进!本科起报!双证毕业!
2 月前
我的钢铁网
·
宏观“三板斧”过后,黑色系后续如何
1 月前