专栏名称: 夕小瑶科技说
这里有自然语言处理、机器学习、算法的入门指导、科普与深度干货,有小夕的回忆与日常,还有最重要的:萌!气!
今天看啥  ›  专栏  ›  夕小瑶科技说

阿里推出世界最强的数学模型Qwen2-Math,击败GPT4o、Claude3.5

夕小瑶科技说  · 公众号  ·  · 2024-08-20 16:05

文章预览

夕小瑶科技说 原创 作者 | 谷雨龙泽 上周,阿里通义团队宣布,模型又迎来了一次升级,他们推出了专用于解决数学问题的Qwen2-Math! Qwen2-Math模型简介 通义千问的数学模型包括Qwen2-Math 和 Qwen2-Math-Instruct-1.5B/7B/72B。这批模型是一系列基于 Qwen2 LLM 构建的专用数学语言模型,其数学能力明显强于开源模型甚至闭源模型(如 GPT-4o)的数学能力。 根据研发团队的评测,其中量最大的数学模型Qwen2-Math-72B-Instruct登顶全服最强,拳打GPT-4o、Claude-3.5-Sonnet,脚踢Gemini-1.5-Pro和Llama-3.1-405B。 基础模型 Qwen2-Math Qwen2-Math 的基础模型使用Qwen2-1.5B/7B/72B 进行初始化,然后在团队构建的数学专用数据上进行预训练。数据包含通义千问合成的大规模高质量数学网络内容、数学书籍、代码、试题和数学预训练数据。比如这就是其中一道用来训练的数学题: 好吧,笔者承认,我已 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览