北大才女李飞飞，花了363元，做出媲美DeepSeek的AI模型

深蓝财经 · 公众号 · · 2025-02-07 18:11

文章预览

■ 销量大跌50%！华为系“宠儿”赛力斯，突然失速 ■ 重磅！万科管理层大洗牌，国资团队全面登场！来源 | 奇偶工作室撰文 | 一个基哥 DeepSeek R1 引爆了全球科技界，全球不少AI研究团队，都在尝试复现DeepSeek的奇迹。这不，又一个成果来了。李飞飞等斯坦福大学和华盛顿大学的研究人员，站在开源模型Qwen2.5的肩膀上，训练成本仅花了不到50美元，就成功训练出了s1的AI推理模型，性能媲美OpenAI！在数学和编程能力测试中，s1的表现与OpenAI的o1模型和DeepSeek R1模型相当！ s1的代码和数据已在GitHub上开源，共其他人使用。 1 训练成本不到50美元 s1模型论文的作者，斯坦福大学在读博士 Niklas Muennighoff在论文中表示，训练过程使用了16个英伟达 H100 GPU，耗时 26 分钟。以不到50美元的云计算费用，约合人民币约362元，就训练了一个名叫s1的人工智能 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

Vista看天下 · 杭州建的“小巴黎”，最近翻红成旅游景点了

8 月前

锂电前沿 · 宁德时代卖咖啡了？

7 月前

社会学视野 · 《社会学评论》 |黄杰、郑静：皆大欢喜：代际传承、社会合法性与民营企业慈善捐赠

3 月前

德鲁克博雅管理 · 做好目标管理的八个技巧

1 月前

大江网 · 韩安冉离婚冲上热搜，已结婚四次！其夫宋浩然回应：将一起解决问题

2 周前