今天看啥  ›  专栏  ›  InfoQ

苹果一篇论文把大模型圈子得罪了!“踩着”OpenAI、Meta大模型上位,Gary Marcus:早就说大模型不会推理!

InfoQ  · 公众号  · 科技媒体  · 2024-10-16 14:24
    

主要观点总结

苹果公司六位AI研究人员近日发表了一篇关于LLM的论文,指出语言模型中存在的推理问题。论文指出,语言模型依赖模式匹配而非真正的逻辑推理,对细微变化的措辞和无关信息非常敏感,导致模型性能不稳定。论文引发了广泛讨论,有人质疑论文的逻辑性和目的,也有人认为论文有一定价值。此外,几何智能公司创始人兼首席执行官Gary Marcus也发表了对该论文的看法,他认为LLM无法进行足够抽象的形式推理。同时,他也强调了神经符号人工智能的重要性。QCon全球软件开发大会将探讨AI等前沿技术趋势。

关键观点总结

关键观点1: 论文指出语言模型存在的问题

苹果公司的AI研究人员在论文中指出,他们在语言模型中没有发现任何形式推理的东西,模型的行为更适合用复杂的模式匹配来解释。论文强调了语言模型对细微变化的措辞和无关信息的敏感性。

关键观点2: 论文引发的不同观点

论文引发了广泛的讨论和争议。有人质疑论文的逻辑性和目的,认为论文缺乏对传统推理概念的定义和解释。也有人认为论文有意义,但推理联系有些牵强。还有人对人工智能论文的质量表示担忧。

关键观点3: Gary Marcus的观点

几何智能公司创始人兼首席执行官Gary Marcus认为LLM无法进行足够抽象的形式推理,并强调了神经符号人工智能的重要性。他提出当前的结果是可靠的,并强调了符号操作在知识抽象中的重要作用。

关键观点4: QCon全球软件开发大会的议题

QCon全球软件开发大会将探讨AI等前沿技术趋势,包括云原生工程、架构、线上可靠性、大前端、技术管理等经典内容,以及AI Agent、AI Infra、RAG等大热的AI话题。大会将有多位资深专家分享落地实践案例和前沿技术趋势。


文章预览

整理 | 褚杏娟、平川 苹果公司六位勇于挑战主流思潮的 AI 研究人员 Iman Mirzadeh、Keivan Alizadeh、Hooman Shahrokhi、Oncel Tuzel、Samy Bengio 和 Mehrdad Farajtabar,近日发表了一篇关于 LLM 的精彩论文。其中有一段很关键: 我们在语言模型中没有发现任何形式推理的东西……它们的行为更适合用复杂的模式匹配来解释……事实上,这种模式匹配非常脆弱,改个名称就可能改变结果约 10%! 他们得出的结论在人工智能社区引起轩然大波,很多人对论文本身提出了很大的质疑。 论文地址: https://arxiv.org/pdf/2410.05229 苹果的研究人员对一系列领先语言模型,包括来自 OpenAI、Meta 和其他知名厂商的模型进行研究测试,以确定这些模型处理数学推理任务的能力。结果表明,问题措辞的细微变化都会导致模型性能出现重大差异,从而削弱模型在需要逻辑一致性场景中的可靠性。 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览