专栏名称: AINLP
关注AI、NLP相关技术,关注算法研发职位和课程;回复"文章"获取历史信息;双语聊天机器人"无名";中英翻译请输入:翻译 翻译内容;自动对联,请输入:上联 上联内容;调戏夸夸聊天机器人,请求夸、求赞;查询相似词,请输入: 相似词 词条
今天看啥  ›  专栏  ›  AINLP

大模型数学推理数据合成相关方法

AINLP  · 公众号  ·  · 2025-01-20 22:58
    

文章预览

©  作者|王家鹏 ‍ ‍ ‍ ‍ ‍ ‍ ‍ ‍ ‍ ‍ ‍ 机构|中国人民大学 研究方向|大语言模型 数学推理能力作为大模型的核心能力之一,近年来受到学术界广泛关注,其性能表现也取得了显著提升。研究表明,高质量的训练数据是提升大语言模型数学推理能力的关键基础。然而,由于数学领域专业标注成本高昂、优质监督数据稀缺,大规模高质量数据集的获取成为制约模型性能提升的主要瓶颈。为突破这一限制,研究者们提出了多种创新性的数据合成方法,这些方法不仅有效解决了数据稀缺问题,还为模型性能提升提供了新的思路。本文将介绍大模型数学推理数据合成的几种相关方法和研究工作。 文章也同步发布在  AI   Box  知乎专栏(知乎搜索 AI Box 专栏),欢迎大家在知乎专栏的文章下方评论留言,交流探讨! ‍ 一、增强现有数据‍‍‍ ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览