今天看啥  ›  专栏  ›  深度学习与NLP

如何看待阿里通义团队新发布的Qwen2-Math,在数学推理领域大幅度超过GPT–4系列?

深度学习与NLP  · 知乎回答  · AI  · 2024-08-10 10:22

文章预览

阿里发布了Qwen2 开源家族的新成员——Qwen2-Math- 1.5B/7B/72B 系列。Qwen2-Math 是一系列基于 Qwen2 LLM 构建的专门用于数学解题的语言模型,其数学能力显著超越了开源模型,甚至超过了闭源模型(如 GPT-4o )。 他们希望Qwen2-Math能够为科学界解决 需要复杂多步逻辑推理的高级数学问题 做出贡献。在一系列数学基准评测上评估了数学专用模型 Qwen2-Math。在 Math 上的评测结果表明,最大的数学专用模型 Qwen2-Math-72B-Instruct 超越了最先进的模型,包括 GPT-4o、Claude-3.5-Sonnet、Gemini-1.5-Pro 和 Llama-3.1-405B。 Qwen2-Math基础模型 Qwen2-Math 的基础模型使用 Qwen2-1.5B/7B/72B 进行初始化,然后在精心设计的数学专用语料库上进行预训练,该语料库包含大规模高质量的数学网络文本、书籍、代码、考试题目以及由 Qwen2 模型合成的 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览