专栏名称: 新闻广角
泉州广播电视台新闻中心新闻栏目 关注民生服务社会 新闻热线0595-22300000
今天看啥  ›  专栏  ›  新闻广角

李飞飞团队训练出媲美DeepSeek R1的推理模型,云计算费用不到50美元

新闻广角  · 公众号  · 闽南  · 2025-02-06 17:55
    

文章预览

6日讯,李飞飞等斯坦福大学和华盛顿大学研究人员近日以不到50美元的云计算费用训练了一个名叫s1的人工智能推理模型。 该模型在数学和编码能力测试中的表现与OpenAI的o1和DeepSeek的R1等尖端推理模型类似。 研究人员表示,s1是通过蒸馏法由谷歌推理模型Gemini 2.0 Flash Thinking Experimental提炼出来的,使用16个英伟达H100 GPU进行了26分钟的训练。 小K注:“不到50美元”仅为云计算服务费用,不包括服务器、显卡等硬件投入费用,因这部分已经由云厂商承担。 来源:财联社 【新闻广角】一审: 林春婷 【新闻广角】二审:黄美清 【新闻广角】三审:潘海阳 郑云涛 点 和 持续关注 ↓↓↓ ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览