专栏名称: 量子位
վ'ᴗ' ի 追踪AI行业和技术动态,这里更快一步!关注我们,回复“今天”,更多大新闻等你来发现
今天看啥  ›  专栏  ›  量子位

DeepSeek满血微调秘籍开源!站在巨人肩膀打造私有模型,一手教程在此

量子位  · 公众号  · AI  · 2025-02-19 11:18
    

文章预览

小明 发自 凹非寺 量子位 | 公众号 QbitAI DeepSeek爆火甚至引发API低价内卷…… 但是别忘了开源模型的最大好处是提供了 “巨人的肩膀” 啊! 微调DeepSeek-V3/R1,低成本打造高质量私有模型、提高业务竞争力,或许才是当下行业内更迫切的需求。 就在刚刚,已收获近 4万GitHub Star Colossal-AI发布 开源大模型后训练工具箱 ,它包含: DeepSeek-V3/R1满血671B LoRA低成本SFT微调; 完整的强化学习工具链PPO、GRPO、DPO、SimPO等; 无缝适配 DeepSeek系列蒸馏模型 在内的HuggingFace开源模型; 兼容支持 英伟达GPU 、 华为昇腾NPU 等多种硬件; 支持混合精度训练,gradient checkpoint等训练加速降低成本; 灵活的训练配置接口,支持自定义奖励函数、损失函数等; 提供灵活的并行策略配置接口,包括数据并行、模型并行、专家并行、ZeRO和Offload等,以适应不同硬件规模。 开源地址 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览