专栏名称: Datawhale
一个专注于AI领域的开源组织,汇聚了众多顶尖院校和知名企业的优秀学习者,聚集了一群有开源精神和探索精神的团队成员。愿景-for the learner,和学习者一起成长。
今天看啥  ›  专栏  ›  Datawhale

单卡复现 DeepSeek R1 Zero教程来了!

Datawhale  · 公众号  ·  · 2025-02-15 22:00
    

文章预览

 Datawhale干货  作者 : 邓恺俊,Datawhale成员 项目代码可见:unlock-deepseek/Datawhale-R1(https://github.com/datawhalechina/unlock-deepseek),欢迎关注和 star! 其余所有开源内容见文末。 各位同学好,我是来自 Unlock-DeepSeek 团队的邓恺俊。 之前有同学问:主播主播,你们团队的复现的 R1 Zero 确实很强,但是还是太耗算力资源,没 3 张 A800 啊,还有没有更经济更简单的方式来学习 R1 Zero 的复现呢?  有的,兄弟,有的有的,像这样的方案还有九个(开玩笑)。今天我们来介绍一个有趣的方法, 能够让你在单卡复现 DeepSeek R1 Zero,甚至只用一块 4090 显卡也能轻松实现!   为什么单卡就能复现? 你可能会问:“原来需要 3 张 A800,如今怎么只需单卡?这其中有什么黑科技?” 答案就在于我们引入了  Unsloth + LoRA 。 Unsloth 的核心优势在于:  强化学习算法优化 :集 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览