专栏名称: 智东西
智东西-聚焦智能变革,服务产业升级!作为智能行业新锐媒体,智东西专注五大领域:VR/AR;AI/机器人/无人机;智能汽车/智能出行;智能家居/物联网;智能穿戴/智能医疗,通过内容、活动、报告以及社群等方式助力“智能+”时代的创业和产业升级。
今天看啥  ›  专栏  ›  智东西

全球开源大模型新王!阿里Qwen2.5来了,性能跨量级超Llama3.1

智东西  · 公众号  · 科技媒体  · 2024-09-19 18:56

主要观点总结

本文主要介绍了阿里云推出的全球最强开源大模型Qwen2.5,其性能跨量级超越Llama3.1-405B,成为新的全球开源大模型王座。文章详细描述了Qwen2.5系列模型的特点和优势,包括语言模型、视觉语言模型、编程模型和数学模型等,并且衍生大模型超过5万个。文章还提到了阿里云CTO周靖人公布的最新数据,证实了通义千问大模型的受欢迎程度和影响力。最后,文章指出开源模型正在赶超闭源模型,行业正进入新的分水岭时刻。

关键观点总结

关键观点1: Qwen2.5性能跨量级超越Llama3.1-405B,成为全球最强开源大模型。

Qwen2.5系列模型包括语言模型、视觉语言模型、编程模型和数学模型等,超过100个新上架开源模型。Qwen2.5支持高达128K的上下文长度,可生成最多8K内容,支持超29种语言。基于18T token数据预训练,Qwen2.5整体性能提升18%以上。旗舰模型Qwen2.5-72B在MMLU-rudex基准、MBPP基准和MATH基准的得分高达86.8、88.2、83.1。

关键观点2: 通义千问大模型累计下载量突破4000万,衍生大模型超过5万个。

通义千问已成为仅次于Llama的世界级模型群。截至9月初,通义原生模型和衍生模型总数超过5万个。通义大模型在服务各行各业的30多万客户中表现出色,实现了AI规模化落地。

关键观点3: 阿里云是国内唯一坚定明确模型开源开放的云巨头。

阿里云在模型突破、生态兼容、开发者服务等方面做出了巨大投入。通义大模型的开源开放策略促进了全球AI产业的发展,让众多行业和企业实现更低成本AI规模化落地。


文章预览

通义千问Qwen下载量突破4000万,“产仔”超5万个。 作者 |   三北 编辑 |   漠影 云计算“春晚”云栖大会开幕,通义千问大模型再次燃爆全场! 智东西9月19日杭州报道,今日,阿里云推出 全球最强开源大模型Qwen2.5-72B ,性能“跨量级”超越Llama3.1-405B,再登全球开源大模型王座。 ▲Qwen2.5-72B在多项权威测试中超越Llama-405B 同时,一大串Qwen2.5系列模型随之开源 ,包括:语言模型Qwen2.5、视觉语言模型Qwen2-VL-72B、编程模型Qwen2.5-Coder、数学模型Qwen2.5-Math等,累计上架 超100个 ,部分性能 赶超GPT-4o ,刷新世界纪录。 “今天是疯狂星期四”、“史诗级产品”……发布几个小时里,Qwen2.5在海内外社交媒体上掀起讨论热潮,全球开发者纷纷加入试用测试队伍。 ▲Qwen2.5在海内外社交媒体上掀起讨论热潮 智东西也第一时间在魔搭平台上试用了Qwen2.5,以结合视 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览