专栏名称: 深度学习与NLP
专注深度学习、NLP相关技术、资讯,追求纯粹的技术,享受学习、分享的快乐。
今天看啥  ›  专栏  ›  深度学习与NLP

阿里史上最大规模开源发布,超GPT-4o 、Llama-3.1!

深度学习与NLP  · 公众号  ·  · 2024-09-20 00:00

文章预览

今天凌晨,阿里巴巴官宣了史上最大规模的开源发布,推出了基础模型Qwen2.5、专用于编码Qwen2.5-Coder和数学的Qwen2.5-Math。 这三大类模型一共有10多个版本,包括0.5B、1.5B、3B、7B、14B、32B和72B,适用于个人、企业以及移动端、PC等不同人群不同业务场景的模型。 如果不想进行繁琐的部署,阿里还开放了旗舰模型Qwen-Plus 和 Qwen-Turbo的API,帮助你快速开发或集成生成式AI功能。 开源地址:https://huggingface.co/collections/Qwen/qwen25-66e81a666513e518adb90d9e Github:https://github.com/QwenLM/Qwen2.5?tab=readme-ov-file 在线demo:https://huggingface.co/spaces/Qwen/Qwen2.5 API地址:https://help.aliyun.com/zh/model-studio/developer-reference/what-is-qwen-llm 下面「AIGC开放社区」详细为大家介绍这些模型的性能特点以及测试结果。 Qwen2.5系列性能测试 本次阿里开源的最大版本指令微调模型Qwen2.5-72B在MMLU-Pro MMLU-redux、GPQA ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览