连接人工智能技术人才和产业人才的交流平台
今天看啥  ›  专栏  ›  机器学习研究组订阅

Ilya预言错了!华人Nature一作给RLHF「判死刑」,全球大模型都不可靠

机器学习研究组订阅  · 公众号  · AI  · 2024-09-29 18:07
    

文章预览

2022年,AI大牛Ilya Sutskever曾预测:「随着时间推移,人类预期和AI实际表现差异可能会缩小」。 ,时长 02:19 然而,一篇最新发表在Nature上的研究表明,事实并非如此! 世界上所有的大模型,甚至指令微调后的LLM,竟是一个「巨大的草台班子」。 论文地址:https://www.nature.com/articles/s41586-024-07930-y 来自VRAIN、剑桥等机构研究人员对o1-preview等领先的LLM开启了全方位评测,结果发现: - LLM & 人类无法保持一致:人类认为复杂的任务,LLM轻易解决;而对人类小菜一碟的问题,LLM却失败了。 - LLM不会「回避」复杂任务,而是强撑面子费力思考半天,最终仍旧答错。 - 提示工程,无法挽救LLM的不可靠。 且看CoT「推理王者」o1-preview,既能解决非常复杂的字谜任务,却在超级简单的任务中犯错。 (上)根据所给字母,成功拼出了electroluminescence(电场发光);(下 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览