专栏名称: 量子位
վ'ᴗ' ի 追踪AI行业和技术动态,这里更快一步!关注我们,回复“今天”,更多大新闻等你来发现
今天看啥  ›  专栏  ›  量子位

AI能自主出“竞赛题”了!港大&蚂蚁让大模型学会生成难题,水平已接近AIME

量子位  · 公众号  · AI  · 2025-03-14 15:22
    

文章预览

赵学亮 投稿 量子位 | 公众号 QbitAI 大模型架构研究进展太快,数据却快要不够用了,其中问题数据又尤其缺乏。 为此,港大和蚂蚁的研究人员 反向利用思维链 ,提出了PromptCoT方法,并基于Llama3.1-8B训练了一个 问题生成模型 。 实验结果表明,合成的问题难度较开源数据和已有算法有显著提升, 接近了AIME水平 。 研究团队利用问题生成模型构造了400k SFT数据。 基于这份数据,团队训练了DeepSeek-R1-Distill-Qwen-7B模型,在MATH-500、AIME 2024以及AIME 2025上的表现均超过了32B的s1模型。 并且相比DeepScaleR-1.5B-Preview,PromptCoT-DS-1.5B仅用1/15的GPU hours即可达到相似的结果。 所有模型和数据均已开源。社区可以根据自己需求合成任意问题数据,用于模型蒸馏或RL训练。 大模型训练缺乏“难题” 当大模型原理“越辩越明”、开源代码越来越多时,数据的不足反而成了限制 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览