注册登录

专栏名称: 吃果冻不吐果冻皮

专注于AI工程化（LLM、MLOps、LLMOps、RAG、Agent）落地。

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

目录

相关文章推荐

经济日报 · 小雪丨寒气所薄凝而为雪 · 9 小时前

墨香中华 · 他因“嘴歪”演了一辈子坏人，没有想到，女儿竟 ... · 昨天

FM93交通之声 · 太突然！价格暴跌！有人坐不住了... · 2 天前

FM93交通之声 · 刚刚！突发6.1级地震 · 4 天前

FM93交通之声 · 45岁高圆圆刚刚发布！网友炸锅.... · 6 天前

今天看啥 › 专栏 › 吃果冻不吐果冻皮

Qwen2.5-Math 技术报告详解

吃果冻不吐果冻皮 · 公众号 · · 2024-10-23 21:42

文章预览

原文：https://zhuanlan.zhihu.com/p/865777418 简介 Qwen2.5-Math 是 Qwen2-Math 的升级版本，包括基础模型 Qwen2.5-Math-1.5B/7B/72B，指令微调模型Qwen2.5-Math-1.5B/7B/72B-Instruct 和数学奖励模型 Qwen2.5-Math-RM-72B。相较于 Qwen2-Math 只支持使用思维链（CoT）解答英文数学题目，Qwen2.5 系列扩展为同时支持使用思维链和工具集成推理（TIR）解决中英双语的数学题。Qwen2.5-Math 系列相比上一代 Qwen2.5-Math 在中文和英文的数学解题能力上均实现了显著提升。图1：在MATH上的效果图2: 开源数据集评测此外，使用 TIR 能进一步提升模型效果。图3：使用TIR工具调用能进一步提升效果下面是一个使用 TIR 的例子：图4: 使用TIR 由于使用 TIR 需要调用 Agent，因此如果是直接推理，模型的输出会有问题。下面的例子中，代码正确的结果应该是((159, 160, 161, 162), 642) ，如果不掉用 Agent，模型依然会 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

经济日报 · 小雪丨寒气所薄凝而为雪

9 小时前

墨香中华 · 他因“嘴歪”演了一辈子坏人，没有想到，女儿竟是我们熟悉的她！

昨天

FM93交通之声 · 太突然！价格暴跌！有人坐不住了...

2 天前

FM93交通之声 · 刚刚！突发6.1级地震

4 天前

FM93交通之声 · 45岁高圆圆刚刚发布！网友炸锅....

6 天前

信达生物 · 信达生物积极探索AI药物研发平台建设，为药物研发注入新动能

4 月前

关于移动版 · Py中国 · RSS之家 · CodingPro · Code · Link之家 · 卧龙AI搜索 · 小百科

今天看啥 - 微信公众号rss订阅, 微信rss, 稳定的RSS源

© 2024 ~ 沪ICP备11025650号