专栏名称: DeepTech深科技
“DeepTech深科技”是与麻省理工科技评论官方独家合作的一个新科技内容品牌。我们专注于关注三个方面:1、基于科学的发现;2、真正的科技创新;3、深科技应用的创新。
今天看啥  ›  专栏  ›  DeepTech深科技

科学家为大模型能力“涌现现象”提供实证反例,并进行心理学层面的解释

DeepTech深科技  · 公众号  · 科技媒体  · 2025-02-24 21:27
    

文章预览

近年来,大模型之所以能够获得成功,其中一个重要原因是所谓的“涌现现象”——基于海量的训练数据和参数,大模型在执行未经专门训练的任务时,常常会涌现出超出预期的卓越能力。 以数学为例,主流的大模型普遍展现出了解答数学问题的推理能力。特别是在思维链方法的启发下,人们普遍认为大模型解决数学问题的能力可以得到进一步增强。 然而,由于大规模神经网络的复杂性造成的不可解释性,关于大模型如何产生数学推理能力的原理和机制,目前尚未有明确的科学定论。 为了提升大模型的可解释性,学术界开始借鉴人类心理学的方法来研究大模型的思维模式。来自德国斯图加特大学、美国加州大学圣地亚哥分校和美国哈佛大学的研究者在 Nature Computational Science 上发表的一项实证论文表明,思维链方法可以帮助大模型识别心理学中 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览