文章预览
阿里通义大模型又又又开源了。 2024云栖大会,通义发布新一代开源模型Qwen2.5并且首次公布开源生态数据。全球已有5万多个基于Qwen二次训练的衍生模型,仅次于美国开源模型Llama(7万左右衍生模型)。 进入开源世界一年多,中国大模型造出了自己的开源雨林。 Qwen2.5-72B,硬刚Llama3.1-405B 通义新一代开源模型 Qwen2.5,又给AI圈带来一点小小震撼。 首先是性能水平 。Qwen2.5旗舰模型Qwen2.5-72B刷新开源性能天花板,其指令跟随版本Qwen2.5-72B-Instruct在MMLU-redux、MATH、MBPP等基准测评中,以不到1/5的参数获得超越Llama3.1-405B的成绩。 在MMLU-redux等十多个基准测评中,Qwen2.5-72B表现超越Llama3.1-405B 两个月前Meta开源Llama3.1-405B,不仅贡献了性能无敌的巨无霸,更是制造了AI圈新共识:开源超越闭源。 Llama3.1-405B在很多任务中都可与GPT-4o、Claude 3.5 Sonnet等顶级闭源模型一战。
………………………………