专栏名称: 阿里云开发者
阿里巴巴官方技术号,关于阿里的技术创新均将呈现于此
今天看啥  ›  专栏  ›  阿里云开发者

大模型无缝切换,QwQ-32B和DeepSeek-R1 全都要

阿里云开发者  · 公众号  · 科技公司  · 2025-03-10 18:00
    

文章预览

近期,通义千问发布了最新推理模型 QwQ-32B。在各类基准测试中,拥有 320 亿参数的 QwQ 模型,其性能可与具备 6710 亿参数(其中 370 亿被激活)的 DeepSeek-R1 媲美。这意味着: 个人用户可以在更小的移动设备上、本地就能运行 企业用户推理大模型 API 的调用成本,可再降90%以上 📊 价格对比: 如果是通过调用官方 API 的方式: 🔹 DeepSeek R1:$0.14/M 输入, $2.19/M 输出 🔹 QwQ-32B:$0.20/M 输入, $0.20/M 输出 如果是通过云上自建(通过阿里云 PAI/ACS 等)的方式,例如阿里云 PAI: 🔹 DeepSeek R1:至少 2 台 8 卡 H20,100w+ / 年 🔹 QwQ-32B:1 台 单卡 H20,5w+ / 年 技术管理者们开始紧锣密鼓的重新梳理大模型业务的 ROI,工程师们开始在后端大模型添加 QwQ-32B 的版本,并切换为主力模型进行测试验证,考虑到开源版本在性能上的相互追赶,对接多个大模型已经成为 AI 应 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览