专栏名称: 采铜的创想世界
本公众号用于发布采铜的思考、鸡汤、故事和诗。欢迎购买本人启智新书《精进:如何成为一个很厉害的人》,京东、当当、亚马逊等各大平台有售。也可去“分答”搜索“采铜”,向我付费提问。
今天看啥  ›  专栏  ›  采铜的创想世界

用一道小学数学的逻辑推理题来检验各家大模型的成色

采铜的创想世界  · 公众号  ·  · 2024-07-02 11:01

文章预览

(这篇文章请你一定要看到最后) 前几天,我写了一篇文章( 当我把这道小学数学题交给AI来做,懂数学和不懂数学的人都沉默了 ),用一道小学数学的几何题来考AI,结果发现不论是国内的主流大模型还是国外最先进的大模型 ,都做错了。 这个结果还是很出人意料。 然后有人留言说,可能问题出在“读图”的环节,AI没把图读对,所以后面的计算也就错了。我想有这个可能。还有人说,大模型是语言模型,它能学会各种语言,但是对于数值计算是不擅长的,这是它先天的机制决定的。我觉得也对。 然后正巧昨天,我让娃在家里练数学,其中有一道题我觉得很有意思,它既不是计算题,也不是几何题,而是一道纯的逻辑推理题,我娃做对了,我就想试试,大模型能不能做对。 我先拍了个照,这道题是这样的: 转成文本: 五个人站成一排,每个 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览