文章预览
阿里发布了Qwen2 开源家族的新成员——Qwen2-Math- 1.5B/7B/72B 系列。Qwen2-Math 是一系列基于 Qwen2 LLM 构建的专门用于数学解题的语言模型,其数学能力显著超越了开源模型,甚至超过了闭源模型(如 GPT-4o )。 他们希望Qwen2-Math能够为科学界解决 需要复杂多步逻辑推理的高级数学问题 做出贡献。在一系列数学基准评测上评估了数学专用模型 Qwen2-Math。在 Math 上的评测结果表明,最大的数学专用模型 Qwen2-Math-72B-Instruct 超越了最先进的模型,包括 GPT-4o、Claude-3.5-Sonnet、Gemini-1.5-Pro 和 Llama-3.1-405B。 Qwen2-Math基础模型 Qwen2-Math 的基础模型使用 Qwen2-1.5B/7B/72B 进行初始化,然后在精心设计的数学专用语料库上进行预训练,该语料库包含大规模高质量的数学网络文本、书籍、代码、考试题目以及由 Qwen2 模型合成的数学预训练数据。在三个广泛使用的英语数学基准 GSM8K
………………………………