专栏名称: 专知
专知,为人工智能从业者服务,提供专业可信的人工智能知识与技术服务,让认知协作更快更好!
今天看啥  ›  专栏  ›  专知

大模型数学推理数据合成相关方法

专知  · 公众号  ·  · 2025-01-20 11:00
    

文章预览

©  作者|王家鹏 ‍ ‍ ‍ ‍ ‍ ‍ ‍ ‍ ‍ ‍ ‍ 机构|中国人民大学 研究方向|大语言模型 数学推理能力作为大模型的核心能力之一,近年来受到学术界广泛关注,其性能表现也取得了显著提升。研究表明,高质量的训练数据是提升大语言模型数学推理能力的关键基础。然而,由于数学领域专业标注成本高昂、优质监督数据稀缺,大规模高质量数据集的获取成为制约模型性能提升的主要瓶颈。为突破这一限制,研究者们提出了多种创新性的数据合成方法,这些方法不仅有效解决了数据稀缺问题,还为模型性能提升提供了新的思路。本文将介绍大模型数学推理数据合成的几种相关方法和研究工作。 文章也同步发布在  AI   Box  知乎专栏(知乎搜索 AI Box 专栏),欢迎大家在知乎专栏的文章下方评论留言,交流探讨! ‍ 一、增强现有数据‍‍‍ ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览