专栏名称: 腾讯科技

只供应最有营养的科技大餐！

我也要提交微信公众号

今天看啥

公众号rss, 微信rss, 微信公众号rss订阅, 稳定的RSS源

微博RSS订阅方法

即刻RSS订阅方法

相关文章推荐

广东省广播电视局官方发布 · 龙粤两省县级融媒体中心对口合作签约对接会在哈 ... · 昨天

产品可靠性报告 · 第五届中国汽车质量技术大会走进宝马，迈向“新世代” · 昨天

36氪 · 饿了么联创的新项目「共比邻」完成过亿元A轮融 ... · 昨天

网信内蒙古 · 中国电信智算云专题会议成功举办 · 2 天前

重庆之声 · 聚焦 | 记住这5点，使用空调既省电又舒服 · 2 天前

今天看啥 › 专栏 › 腾讯科技

大模型连乘法都不会做？一系列新研究再次挑战AI推理能力

腾讯科技 · 公众号 · 科技媒体 · 2024-11-11 14:49

主要观点总结

本文介绍了大语言模型在算术处理上的研究和探讨，包括空间基数、标签空间熵和子群质量等维度的研究，以及大模型在数学运算中的底层逻辑和启发式规则的发现。同时，文章还探讨了OpenAI-o1模型在推理能力上的提升以及COT技术在其中的作用。

大语言模型在进行算术运算时并没有采用我们熟知的计算规则，而是自行发现一些符号上的统计规律。这种独特的模式识别方法被称为“符号学习者”，而非“逻辑学习者”。

大模型在进行数学运算时，通过自回归预测的方式，利用子群逻辑去计算。子群复杂度越低，模型的正确率越高。这种底层逻辑体现在模型的准确率呈U形分布，即头尾数字的准确率远高于中间数字。

通过探测激活神经元，研究者发现了处理数学计算的核心神经元——多层感知器（MLP）。这些神经元在进行数据预测时会被激活，它们通过一些启发式规则来识别计算结果。这些规则包括范围启发式、取模启发式、模式启发式等。

OpenAI-o1模型通过融入COT（思维链）技术，提升了其推理能力。COT技术能够将复杂问题拆解成简单步骤，使得大语言模型能够完成更复杂的数学计算。然而，这种提升是否真正意味着模型学会了数学规则，还是仅仅进行了模式匹配，仍需进一步探讨。

免责声明：本文内容摘要由平台算法生成，仅为信息导航参考，不代表原文立场或观点。原文内容版权归原作者所有，如您为原作者并希望删除该摘要或链接，请通过【版权申诉通道】联系我们处理。

原文地址：访问原文地址
总结与预览地址：访问总结与预览
推荐产品: 推荐产品
文章地址：访问文章快照

分享到微博