专栏名称: 深蓝财经
为财经记者、投资者服务!
目录
相关文章推荐
今天看啥  ›  专栏  ›  深蓝财经

北大才女李飞飞,花了363元,做出媲美DeepSeek的AI模型

深蓝财经  · 公众号  ·  · 2025-02-07 18:11
    

文章预览

■     销量大跌50%!华为系“宠儿”赛力斯,突然失速 ■    重磅!万科管理层大洗牌,国资团队全面登场! 来源 | 奇偶工作室 撰文 | 一个基哥 DeepSeek R1 引爆了全球科技界,全球不少AI研究团队,都在尝试复现DeepSeek的奇迹。 这不,又一个成果来了。 李飞飞等斯坦福大学和华盛顿大学的研究人员,站在开源模型Qwen2.5的肩膀上,训练成本仅花了不到50美元,就成功训练出了s1的AI推理模型,性能媲美OpenAI! 在数学和编程能力测试中,s1的表现与OpenAI的o1模型和DeepSeek R1模型相当! s1的代码和数据已在GitHub上开源,共其他人使用。 1 训练成本不到50美元 s1模型论文的作者,斯坦福大学在读博士 Niklas Muennighoff在论文中表示,训练过程使用了16个英伟达 H100 GPU,耗时 26 分钟。 以不到50美元的云计算费用,约合人民币约362元,就训练了一个名叫s1的人工智能 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览