如何看待阿里通义团队新发布的Qwen2-Math，在数学推理领域大幅度超过GPT–4系列？

深度学习与NLP · 知乎回答 · AI · 2024-08-10 10:22

文章预览

阿里发布了Qwen2 开源家族的新成员——Qwen2-Math- 1.5B/7B/72B 系列。Qwen2-Math 是一系列基于 Qwen2 LLM 构建的专门用于数学解题的语言模型，其数学能力显著超越了开源模型，甚至超过了闭源模型（如 GPT-4o ）。他们希望Qwen2-Math能够为科学界解决需要复杂多步逻辑推理的高级数学问题做出贡献。在一系列数学基准评测上评估了数学专用模型 Qwen2-Math。在 Math 上的评测结果表明，最大的数学专用模型 Qwen2-Math-72B-Instruct 超越了最先进的模型，包括 GPT-4o、Claude-3.5-Sonnet、Gemini-1.5-Pro 和 Llama-3.1-405B。 Qwen2-Math基础模型 Qwen2-Math 的基础模型使用 Qwen2-1.5B/7B/72B 进行初始化，然后在精心设计的数学专用语料库上进行预训练，该语料库包含大规模高质量的数学网络文本、书籍、代码、考试题目以及由 Qwen2 模型合成的 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

爱可可-爱生活 · 【[338星]MCP Directory：为MCP服务器打造的优-20250220141139

昨天

爱可可-爱生活 · 本文创新性地提出了 LLM 驱动的主动数据系统范式，突破了传统被-20250220054149

昨天

机器之心 · DeepSeek V3+R1满血微调工具上线！一键启动，硬件要求降10倍

2 天前

爱可可-爱生活 · 晚安～ #晚安# -20250218225644

2 天前

AIGC开放社区 · 刚刚，马斯克发布Grok-3，反击DeepSeek、OpenAI

3 天前

AIGC开放社区 · 刚刚，马斯克发布Grok-3，反击DeepSeek、OpenAI

3 天前

PCEC 可持续发展服务 · 重磅！生态环境部发文：这些技术将被淘汰！

5 月前

富兰克林读书俱乐部 · 《蒂凡尼的早餐》：一个人最清醒的活法，是过滤自己

5 月前

晓磊的基金生活 · 基金#基金##买基金上微博#我刚刚在微博上购买了这只基金$宏利印-20241212093220

2 月前