专栏名称: 关于NLP那些你不知道的事

整理自然语言处理、推荐系统、搜索引擎等AI领域的入门笔记，论文学习笔记和面试资料（关于NLP那些你不知道的事、关于推荐系统那些你不知道的事、NLP百面百搭、推荐系统百面百搭、搜索引擎百面百搭）

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

重磅！阿里开源325亿参数规模的推理大模型QwQ-32B：性能接近DeepSeek R1满血版，参数更低，免费商用授权！

关于NLP那些你不知道的事 · 公众号 · · 2025-03-07 00:00

文章预览

本文原文来自DataLearnerAI官方博客： https://www.datalearner.com/blog/1051741222029645 就在几个小时前，阿里巴巴开源了最新的一个推理大模型，QwQ-32B，该模型拥有类似o1、DeepSeek R1模型那样的推理能力，但是参数仅325亿，以Apache 2.0开源协议开源，这意味着大家可以完全免费商用。 QwQ-32B模型简介其实，在2024年11月28日，阿里就已经开源了预览版的推理大模型QwQ-32B-Preview，彼时DeepSeek R1尚未发布（2024年11月20日，DeepSeek官宣了DeepSeek-R1-Lite-Preview，但是没开源）。这应该是当时最早开源的推理大模型之一。三个月后的今天，QwQ-32B正式开源，去掉了预览版的标签。相比预览版，正式版的QwQ-32B各方面都有明显的提升，包括上下文长度增加到131K（预览版为32K），AIME评分提升50%等。 QwQ 是 Qwen 系列中的推理模型，相较于传统的指令微调模型，QwQ 具备更强的思考和推理能 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

环保人 · 环评师被批评：布袋除尘器后颗粒物浓度算到0.5？写得这么低的话验收咋办？写多少合适？

6 小时前

环保人 · 危废标签软件免费！联网危废平台免费！三合一打印机1000

6 小时前

新疆生态环境 · 自治区生态环境厅召开天山北坡城市群重点企业“一企一策”污染治理“回头看”工作启动会

11 小时前

新疆生态环境 · 自治区生态环境厅召开天山北坡城市群重点企业“一企一策”污染治理“回头看”工作启动会

11 小时前

环保人 · 环评师被批评：布袋除尘器后颗粒物浓度算到0.5？写得这么低的话验收咋办？写多少合适？

昨天

环保人 · 改扩建项目现有污染源测2天3次的依据是什么？能只测1天1次？请看环境部文件明确依据

2 天前

器械之家 · 进博抢先看：医学影像“黑科技”

5 月前

志公教育 · 实名编制！月薪4000元起，河池市环江县教育系统、顺丰速运等企事业单位新招

3 月前