专栏名称: DeepTech深科技
“DeepTech深科技”是与麻省理工科技评论官方独家合作的一个新科技内容品牌。我们专注于关注三个方面:1、基于科学的发现;2、真正的科技创新;3、深科技应用的创新。
今天看啥  ›  专栏  ›  DeepTech深科技

科学家提出大模型自我纠错链机制,有望提高对数学推理问题的精度

DeepTech深科技  · 公众号  · 科技媒体  · 2024-12-13 18:01
    

文章预览

大模型(诸如 ChatGPT、GPT-4 等)被视为通往通用人工智能征途上的关键前沿突破之一。然而,目前的大模型在逻辑推理方面的能力存在明显不足。 目前,这些大模型的底层机制是 Next Token Prediction,即在回答问题时,大模型基于数据关联性来预测并输出下一个 token 直到结束。 但这种模式类似于人类的快思考,完全没有反思和自我纠错的能力。因此智能化程度偏低,难以处理需要深入推理的问题,比如复杂的数学问题。 让大模型拥有自我纠错的能力 为了克服上述局限性并提高大模型的逻辑推理能力,李志锋博士团队与合作者提出了一种自我纠错链机制(Chain of Self-Correction)。 让大模型在回答问题时,能建立一个内部的自我纠错链路,来验证和纠错拟输出的回答。 图 | 李志锋(来源:李志锋) 将这种机制将反思和自我纠错能力嵌入到大模型中,使 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览