专栏名称: 阿里云大数据AI平台

阿里云大数据AI平台依托阿里领先的云基础设施、大数据和AI工程能力、场景算法技术和多年行业实践，一站式地为企业和开发者提供云原生的大数据和AI能力体系。帮助提升AI应用开发效率，促进AI在产业中规模化落地，激发业务价值。

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

Qwen2.5-Coder 系列模型在 PAI-QuickStart 的训练、评测、压缩及部署实践

阿里云大数据AI平台 · 公众号 · · 2024-11-27 08:00

主要观点总结

本文详细介绍了在阿里云人工智能平台PAI上使用Qwen2.5-Coder系列模型的最佳实践，包括环境要求、模型使用、模型评测、模型压缩等步骤。同时还提供了相关链接和参考资料。

关键观点总结

关键观点1: Qwen2.5-Coder系列模型介绍

Qwen2.5-Coder是阿里云最新推出的大语言模型系列，专门针对代码场景进行训练和优化，具备强大的代码生成、推理和纠错能力。

关键观点2: 阿里云人工智能平台PAI介绍

PAI是一站式AI开发平台，为开发者和企业提供便捷的大模型训练和部署能力。本文介绍了如何使用PAI的QuickStart组件来快速开始模型训练和部署。

关键观点3: Qwen2.5-Coder在PAI上的使用

本文详细阐述了如何在PAI上使用Qwen2.5-Coder系列模型，包括模型卡片的选择、模型部署和调用、微调训练等。

关键观点4: 模型评测

PAI提供了模型评测功能，本文介绍了如何使用公开数据集对模型进行综合能力评估，并给出了自定义数据集和公开数据集评测结果的示例。

关键观点5: 模型压缩

为了提高模型的部署效率，可以对训练后的模型进行压缩。本文介绍了如何使用PAI的模型压缩功能对模型进行压缩和部署。

文章预览

Qwen2.5-Coder 是阿里云最新推出的专门针对代码的 Qwen 大型语言模型系列。目前，Qwen2.5-Coder 覆盖了多种主流模型尺寸：0.5B、1.5B、3B、7B、14B 和 32B，以满足不同开发人员的需求。Qwen2.5-Coder 将训练 tokens 扩展到 5.5 万亿，在代码生成、代码推理和代码纠错能力方面有着显著提升。目前，Qwen2.5-Coder-32B 已成为当前最先进的开源代码 LLM，其编码能力与 GPT-4o 相当，并且还保留了在数学和通用能力方面的能力。阿里云的人工智能平台 PAI，作为一站式、 AI Native 的大模型与 AIGC 工程平台，为开发者和企业客户提供了 Qwen2.5-Coder 系列模型的全链路最佳实践。本文以Qwen2.5-Coder-32B为例，详细介绍在 PAI-QuickStart 完成 Qwen2.5-Coder 的训练、评测和快速部署。 01 PAI-QuickStart 介绍快速开始（PAI-QuickStart）是阿里云人工智能平台 PAI 的产品组件，它集成了国内外 AI 开源社区中 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博