今天看啥  ›  专栏  ›  AI寒武纪

阿里发布Qwen 2.5:历史上最大开源发布

AI寒武纪  · 公众号  ·  · 2024-09-19 10:55

文章预览

紧随OpenAI o1,阿里推出Qwen2.5: 基础模型大派对! 最新发布包括了语言模型 Qwen2.5,以及专门针对编程的 Qwen2.5-Coder和数学的Qwen2.5-Math模型 性能,数学,编程全面提升,很多指标位列开源第一,超过Llama3 405B,具体细节和表现请看图 Qwen开发JunyangLin, 指出此次只是专注于提高预训练数据的质量和数量,只是使用了很多大家熟悉的方法,如文本分类器用于召回高质量数据,LLM 评分器用于对数据进行评分,这样就能在质量和数量之间取得平衡。 在创建专家模型的同时,还利用它们生成合成数据。 在后期训练方面,用户反馈帮助逐一解决问题,同时阿里也在探索 RLHF 方法如何帮助开发,尤其是在线学习方法。 现在,阿里正进入下一阶段,以解决更多难题。 长期以来,阿里一直希望建立一个多模态、多任务的人工智能模型或系统,而现在看来,离实现模 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览