阿里云大数据AI平台依托阿里领先的云基础设施、大数据和AI工程能力、场景算法技术和多年行业实践,一站式地为企业和开发者提供云原生的大数据和AI能力体系。帮助提升AI应用开发效率,促进AI在产业中规模化落地,激发业务价值。
目录
今天看啥  ›  专栏  ›  阿里云大数据AI平台

MaxCompute x DataWorks × DeepSeek,实现使用自定义数据集微调Deep...

阿里云大数据AI平台  · 公众号  · AI  · 2025-02-27 08:00
    

文章预览

01 整体概要 基于阿里云云原生大数据计算服务 MaxCompute 以及大数据开发 治理 平台 DataWorks 实现使用自定义数据集微调 DeepSeek-R1 蒸馏模型主要分为两大部分,一部分是基于人工智能平台 PAI 的微调训练,第二部分是通过如何构建自有数据集,并进行接入,下面我们以 MaxCompute+DataWorks+PAI 为基础,快速微调 DeepSeek-R1 蒸馏模型。 02 如何微调 DeepSeek 进入人工智能平台 PAI 控制台,左侧导航栏进入 快速开始 > Model Gallery ,选择模型。下面我们以 DeepSeek-R1-Distill-Qwen-7B 为例,进行微调训练。(其他模型微调也可以基于这个流程) 进入 DeepSeek-R1-Distill-Qwen-7B 模型页面后,点击“训练”按钮,核心是基于自有数据集进行模型调优,自有数据集可以选择存在对象存储 OSS 的数据,也可以选择存在 MaxCompute 的数据,下面我们以存在 MaxCompute 的数据的自有数据集为例进行 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览