专栏名称: 深度学习与NLP
专注深度学习、NLP相关技术、资讯,追求纯粹的技术,享受学习、分享的快乐。
今天看啥  ›  专栏  ›  深度学习与NLP

菲尔兹奖得主亲测GPT-4o,经典过河难题破解失败!最强Claude 3.5回答离谱,LeCun嘲讽LLM

深度学习与NLP  · 公众号  ·  · 2024-07-01 08:00
    

文章预览

来源 | 新智元  ID | AI-era 经典的「狼-山羊-卷心菜」过河问题上,如今所有的LLM都失败了! 几天前,菲尔兹奖得主、剑桥大学研究主任Timothy Gowers直接拿GPT-4o开刀,去解决动物过河难题。 在此,他给出了一个新的基准——废话比率(crapness ratio),即LLM给出的总答案与正确答案之间的比率。 经过测试,Gowers发现大模型的废话比率可以达到5倍。 一开始,他先给出了一个农民带2只鸡过河,一只船只能容纳一个人和2个动物,那么农夫带着两只鸡渡河所需的最少渡河次数是多少? 别说成年人了,就拿低幼小孩子来说,一听完题目,就立马给出正确的答案。 搞笑的是,ChatGPT的回答分解了5个步骤,让人看着极其愚蠢荒谬。 第一次渡河: 农夫带着两只鸡一起过河;现状: 农夫和两只鸡在河对岸。 第二次渡河: 农夫把两只鸡留在对岸,然后独自返回;现 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览