专栏名称: 界面新闻
界面是中国最大的商业新闻和社交平台,只服务于独立思考的人群。
今天看啥  ›  专栏  ›  界面新闻

阿里凌晨开源新模型:性能对标DeepSeek-R1,参数仅为其1/20

界面新闻  · 公众号  · 热门自媒体  · 2025-03-06 11:46
    

文章预览

图片来源:视觉中国 3月6日凌晨3点,阿里巴巴发布并开源全新的推理模型通义千问QwQ-32B。阿里巴巴称,这是一款拥有320亿参数的模型,其性能可与具备6710亿参数(其中370亿被激活)的DeepSeek-R1媲美。 据悉,QwQ-32B 在一系列基准测试中进行了评估,测试了数学推理、编程能力和通用能力,并与OpenAI的o1-mini以及DeepSeek满血版及蒸馏版进行了比较。 在测试数学能力的AIME24评测集上,以及评估代码能力的LiveCodeBench 中,千问 QwQ-32B表现与DeepSeek-R1相当,远胜于o1-mini及相同尺寸的R1蒸馏模型。 在由Meta首席科学家杨立昆领衔的“最难LLMs评测榜”LiveBench、谷歌等提出的指令遵循能力IFEval评测集、由加州大学伯克利分校等提出的评估准确调用函数或工具方面的BFCL测试中,千问QwQ-32B的得分均超越了DeepSeek- R1。 官方介绍称,这一成果突显了将强化学习应用于经过大 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览