专栏名称: NLP工作站
AIGC前沿知识分享&落地经验总结
今天看啥  ›  专栏  ›  NLP工作站

没有等来Qwen2.5,但等来了Qwen2-Math

NLP工作站  · 公众号  ·  · 2024-08-08 23:01

文章预览

Qwen2又出新作Math大模型,你值得拥有。 我没有等来Qwen2.5,但等来了Qwen2-Math ,在数学推理能力上大幅度提高,先来一张图阵阵场子,72B模型超过GPT4-o、Claude-3.5-Sonnet和Gemini-1.5-Pro。 Blog: https://qwenlm.github.io/blog/qwen2-math/ HF:https://huggingface.co/collections/Qwen/qwen2-6659360b33528ced941e557f 本次开源共涉及3个尺寸2个版本,分别为Qwen2-Math-1.5B、Qwen2-Math-1.5B-Instruct、Qwen2-Math-7B、Qwen2-Math-7B-Instruct、Qwen2-Math-72B和Qwen2-Math-72B-Instruct。 模型训练初始化采用Qwen2-1.5B、Qwen2-7B和Qwen2-72B,训练语料涉及高质量的数学网络文本、书籍、代码、考试题目以及由 Qwen2模型合成的数学预训练数据 。 指令微调阶段是先用Qwen2-Math-72B训练了一个数学专用的奖励模型,然后利用该奖励模型和指示模型回答问题是否正确这两个指标一起拒绝采用构建SFT数据集,并利用GRPO进一步对齐模型效果。 注 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览