专栏名称: 奇偶工作室
Leo和基哥联手,打造有趣有料有情怀的科技号。一点资讯视频榜TOP10、科技前瞻奖。网易新闻年度短视频风云作者、网易短视频签约达人。
目录
相关文章推荐
今天看啥  ›  专栏  ›  奇偶工作室

北京大学大佬,花了363元,做出媲美DeepSeek的AI模型

奇偶工作室  · 公众号  ·  · 2025-02-06 21:36
    

文章预览

DeepSeek R1 引爆了全球科技界,全球不少AI研究团队,都在尝试复现DeepSeek的奇迹。 这不,又一个成果来了。 李飞飞等斯坦福大学和华盛顿大学的研究人员,站在开源模型Qwen2.5的肩膀上,训练成本仅花了不到50美元,就成功训练出了s1的AI推理模型,性能媲美OpenAI! 在数学和编程能力测试中,s1的表现与OpenAI的o1模型和DeepSeek R1模型相当! s1的代码和数据已在GitHub上开源,共其他人使用。 训练成本不到50美元 s1模型论文的作者,斯坦福大学在读博士 Niklas Muennighoff在论文中表示,训练过程使用了 16个英伟达 H100 GPU,耗时 26 分钟。 以不到50美元的云计算费用,约合人民币约362元,就训练了一个名叫s1的人工智能推理模型。 特别值得一提,这位大佬还是北京大学本科毕业的。 还拿了北大的全额奖学金,北大出人才。 少即是多 开源的胜利 s1也采用了DeekSeek类 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览