苹果一篇论文把大模型圈子得罪了！“踩着”OpenAI、Meta大模型上位，Gary Marcus：早就说大模型不会推理！

InfoQ · 公众号 · 科技媒体 · 2024-10-16 14:24

主要观点总结

苹果公司六位AI研究人员近日发表了一篇关于LLM的论文，指出语言模型中存在的推理问题。论文指出，语言模型依赖模式匹配而非真正的逻辑推理，对细微变化的措辞和无关信息非常敏感，导致模型性能不稳定。论文引发了广泛讨论，有人质疑论文的逻辑性和目的，也有人认为论文有一定价值。此外，几何智能公司创始人兼首席执行官Gary Marcus也发表了对该论文的看法，他认为LLM无法进行足够抽象的形式推理。同时，他也强调了神经符号人工智能的重要性。QCon全球软件开发大会将探讨AI等前沿技术趋势。

关键观点总结

关键观点1: 论文指出语言模型存在的问题

苹果公司的AI研究人员在论文中指出，他们在语言模型中没有发现任何形式推理的东西，模型的行为更适合用复杂的模式匹配来解释。论文强调了语言模型对细微变化的措辞和无关信息的敏感性。

关键观点2: 论文引发的不同观点

论文引发了广泛的讨论和争议。有人质疑论文的逻辑性和目的，认为论文缺乏对传统推理概念的定义和解释。也有人认为论文有意义，但推理联系有些牵强。还有人对人工智能论文的质量表示担忧。

关键观点3: Gary Marcus的观点

几何智能公司创始人兼首席执行官Gary Marcus认为LLM无法进行足够抽象的形式推理，并强调了神经符号人工智能的重要性。他提出当前的结果是可靠的，并强调了符号操作在知识抽象中的重要作用。

关键观点4: QCon全球软件开发大会的议题

QCon全球软件开发大会将探讨AI等前沿技术趋势，包括云原生工程、架构、线上可靠性、大前端、技术管理等经典内容，以及AI Agent、AI Infra、RAG等大热的AI话题。大会将有多位资深专家分享落地实践案例和前沿技术趋势。

文章预览

整理 | 褚杏娟、平川苹果公司六位勇于挑战主流思潮的 AI 研究人员 Iman Mirzadeh、Keivan Alizadeh、Hooman Shahrokhi、Oncel Tuzel、Samy Bengio 和 Mehrdad Farajtabar，近日发表了一篇关于 LLM 的精彩论文。其中有一段很关键：我们在语言模型中没有发现任何形式推理的东西……它们的行为更适合用复杂的模式匹配来解释……事实上，这种模式匹配非常脆弱，改个名称就可能改变结果约 10%！他们得出的结论在人工智能社区引起轩然大波，很多人对论文本身提出了很大的质疑。论文地址： https://arxiv.org/pdf/2410.05229 苹果的研究人员对一系列领先语言模型，包括来自 OpenAI、Meta 和其他知名厂商的模型进行研究测试，以确定这些模型处理数学推理任务的能力。结果表明，问题措辞的细微变化都会导致模型性能出现重大差异，从而削弱模型在需要逻辑一致性场景中的可靠性。 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博