专栏名称: 黄建同学
数码博主 超话主持人(ChatGPT超话) 头条文章作者 我的学习笔记,关注AI+新能源
今天看啥  ›  专栏  ›  黄建同学

这篇内容详细介绍了DeepSeek-R1的预训练过程,《The -20250201083252

黄建同学  · 微博  · AI  · 2025-02-01 08:32
    

文章预览

2025-02-01 08:32 本条微博链接 这篇内容详细介绍了DeepSeek-R1的预训练过程,《The Layman’s Introduction to DeepSeek-R1 Training》(链接见评论区,可以直接拉到中间部分,如果你对英伟达是否继续看涨不感兴趣) 正好,Andrej Karpathy 也发了一篇内容通俗类比了预训练、监督微调(SFT)、强化学习(RL),可以一并看看。 #DeepSeek成精# #ai创造营# #deepseek# ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览