全球5万衍生模型，阿里通义造出开源雨林

OSC开源社区 · 公众号 · 程序员 · 2024-09-20 15:55

文章预览

阿里通义大模型又又又开源了。 2024云栖大会，通义发布新一代开源模型Qwen2.5并且首次公布开源生态数据。全球已有5万多个基于Qwen二次训练的衍生模型，仅次于美国开源模型Llama（7万左右衍生模型）。进入开源世界一年多，中国大模型造出了自己的开源雨林。 Qwen2.5-72B，硬刚Llama3.1-405B 通义新一代开源模型 Qwen2.5，又给AI圈带来一点小小震撼。首先是性能水平。Qwen2.5旗舰模型Qwen2.5-72B刷新开源性能天花板，其指令跟随版本Qwen2.5-72B-Instruct在MMLU-redux、MATH、MBPP等基准测评中，以不到1/5的参数获得超越Llama3.1-405B的成绩。在MMLU-redux等十多个基准测评中，Qwen2.5-72B表现超越Llama3.1-405B 两个月前Meta开源Llama3.1-405B，不仅贡献了性能无敌的巨无霸，更是制造了AI圈新共识：开源超越闭源。 Llama3.1-405B在很多任务中都可与GPT-4o、Claude 3.5 Sonnet等顶级闭源模型一战。 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博