专栏名称: 我爱计算机视觉
关注计算机视觉与机器学习技术的最前沿,“有价值有深度”,分享开源技术与最新论文解读,传播CVML技术的业内最佳实践。www.52cv.net 微博:计算机视觉与机器学习,QQ群:928997753,52CV君个人账号:Your-Word。
今天看啥  ›  专栏  ›  我爱计算机视觉

开源模型争霸赛!Qwen2.5登顶!72B模型击败LIama3 405B,轻松胜过GPT-4o-mini

我爱计算机视觉  · 公众号  ·  · 2024-09-19 22:29
    

文章预览

关注公众号,发现CV技术之美 白小交 发自 凹非寺 量子位 | 公众号 QbitAI 击败LIama3!Qwen2.5登上全球开源王座。 而后者仅以五分之一的参数规模,就在多任务中超越LIama3 405B。 各种任务表现也远超同类别的其他模型。 跟上一代相比,几乎实现了全面提升,尤其在一般任务、数学和编码方面的能力表现显著。 值得注意的是,此次Qwen可以说是史上最大规模开源,基础模型直接释放了7个参数型号,其中还有六七个数学、代码模型。 像14B、32B以及轻量级Turbo模型胜过GPT-4o-mini。 除3B和72B模型外,此次所有开源模型均采用Apache 2.0许可。 Qwen2.5:0.5B、1.5B、3B、7B、14B、32B和72B Qwen2.5-Coder:1.5B、7B和32B(on the way) Qwen2.5-Math:1.5B、7B和72B。 直接一整个眼花缭乱,已经有网友开始用上了。 Qwen2.5 72B与LIama3.1 405B水平相当 相比于Qwen2系列,Qwen2.5系列主要有这么几个方 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览