注册
登录
专栏名称:
AI范儿
AI领域四大媒体之一。 智能未来,始于Prompt!
我也要提交微信公众号
今天看啥
微信公众号rss订阅, 微信rss, 稳定的RSS源
微信公众号RSS订阅方法
B站投稿RSS订阅方法
雪球动态RSS订阅方法
微博RSS订阅方法
微博搜索关键词订阅方法
豆瓣日记 RSS订阅方法
目录
相关文章推荐
高分子科技
·
复旦朱亮亮/台大周必泰 ...
·
昨天
高分子科学前沿
·
吉林大学,最新Nature ...
·
昨天
高分子科学前沿
·
北师大李阳教授团队《自然·通讯》:构建同步负 ...
·
2 天前
高分子科学前沿
·
DeepSeek锐评高分子专业!没有“躺平” ...
·
3 天前
高分子科学前沿
·
苏州大学方剑/NUS陈瑞深AFM:主动热场集 ...
·
5 天前
今天看啥
›
专栏
›
AI范儿
推理?别闹了!现在的 AI 仍然连小学数学题都搞不定!
AI范儿
·
公众号
· · 2024-10-16 12:21
文章预览
“ 研究发现,尽管OpenAI和Google等公司强调其AI模型的推理能力,但苹果的研究表明,当前的大型语言模型(LLMs)在面对微小变化时,推理能力脆弱且不可靠。 测试结果显示,模型依赖于模式匹配,而非真正的逻辑推理,揭示了其在复杂任务中的局限性。 最近,OpenAI 和 Google 等公司一直在宣传他们的人工智能(AI)模型在“推理”方面的先进能力,认为这是技术发展的重要一步。 然而,苹果公司的六位 工程师最近做的一项研究发现,这些大型语言模型(LLMs)在面对一些看似小的变化时, 其数学推理能力其实很脆弱,也不太可靠。 研究表明,LLMs并没有真正理解基本概念,而是通过匹配训练数据中的概率模式来工作。研究人员认为:“ 现在的LLMs并不具备真正的逻辑推理能力,它们只是模仿在训练中见过的推理步骤。 ” 在一篇名为《GSM-Symbolic: 理 ………………………………
原文地址:
访问原文地址
快照地址:
访问文章快照
总结与预览地址:
访问总结与预览
分享到微博
推荐文章
高分子科技
·
复旦朱亮亮/台大周必泰 JACS:通过合理设计构建大环型多硫芳烃分子打造新一代发光机制(nπ* TADF)
昨天
高分子科学前沿
·
吉林大学,最新Nature Nanotechnology!
昨天
高分子科学前沿
·
北师大李阳教授团队《自然·通讯》:构建同步负载银单原子与纳米颗粒的新型漂浮式光催化剂用于高效消毒
2 天前
高分子科学前沿
·
DeepSeek锐评高分子专业!没有“躺平”的命,就得有“卷到死”的觉悟!
3 天前
高分子科学前沿
·
苏州大学方剑/NUS陈瑞深AFM:主动热场集成实现海水淡化阻盐新突破
5 天前
法国文学bot
·
“我在这儿干什么,难道不是在拉皮条?”上尉说。“他们全都在干这件-20240526032934
8 月前
汽车金融大全APP
·
汽车金融人的 boss 直聘,223 个岗位等你来
5 月前
极客公园
·
传苹果英伟达将投资OpenAI;特斯拉或出「中国特供」7座Model Y;中秋国庆调休难,AI也算不对 | 极客早知道
5 月前
春小楼
·
桃花岭上,天地一墅
2 月前
温静聚焦
·
最新!一批纪录片官宣
1 月前