注册登录

专栏名称: 夕小瑶科技说

这里有自然语言处理、机器学习、算法的入门指导、科普与深度干货，有小夕的回忆与日常，还有最重要的：萌！气！

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

目录

相关文章推荐

杭州本地宝 · 好奇！DeepSeek会推荐杭州人周末去哪玩呢？ · 昨天

杭州本地宝 · 大专学历可以申请杭州人才公寓吗？租金打几折？ · 昨天

杭州本地宝 · 杭州身份证换补领，可全程网办！ · 昨天

今天看啥 › 专栏 › 夕小瑶科技说

阿里推出世界最强的数学模型Qwen2-Math，击败GPT4o、Claude3.5

夕小瑶科技说 · 公众号 · · 2024-08-20 16:05

文章预览

夕小瑶科技说原创作者 | 谷雨龙泽上周，阿里通义团队宣布，模型又迎来了一次升级，他们推出了专用于解决数学问题的Qwen2-Math！ Qwen2-Math模型简介通义千问的数学模型包括Qwen2-Math 和 Qwen2-Math-Instruct-1.5B/7B/72B。这批模型是一系列基于 Qwen2 LLM 构建的专用数学语言模型，其数学能力明显强于开源模型甚至闭源模型（如 GPT-4o）的数学能力。根据研发团队的评测，其中量最大的数学模型Qwen2-Math-72B-Instruct登顶全服最强，拳打GPT-4o、Claude-3.5-Sonnet，脚踢Gemini-1.5-Pro和Llama-3.1-405B。基础模型 Qwen2-Math Qwen2-Math 的基础模型使用Qwen2-1.5B/7B/72B 进行初始化，然后在团队构建的数学专用数据上进行预训练。数据包含通义千问合成的大规模高质量数学网络内容、数学书籍、代码、试题和数学预训练数据。比如这就是其中一道用来训练的数学题：好吧，笔者承认，我已 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

杭州本地宝 · 好奇！DeepSeek会推荐杭州人周末去哪玩呢？

昨天

杭州本地宝 · 大专学历可以申请杭州人才公寓吗？租金打几折？

昨天

杭州本地宝 · 杭州身份证换补领，可全程网办！

昨天

晚点LatePost · 【#lululemon股价今年已跌四成#】lululemon 1-20240607223347

8 月前

苏州发布 · 春节期间，不打烊！

4 周前

网易上流 · 广西公文包：喝时甜甜的，喝完癫癫的

1 周前

储能与电力市场 · 广东中山：多项资助推动新能源产业发展，支持新型储能及重大项目建设

6 天前

关于移动版 · Py中国 · RSS之家 · CodingPro · Code · Link之家 · 卧龙AI搜索 · 小百科 · 51好读 · 小百科（海外） · Link管理

今天看啥 - 微信公众号rss订阅, 微信rss, 稳定的RSS源

© 2024 ~ 沪ICP备11025650号