专栏名称: 财联社AI daily

财联社及科创板日报旗下产品，聚焦TMT领域，更独家、更深度。

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

李飞飞团队“50美元”复现DeepSeek R1真相：基座为阿里云Qwen模型

财联社AI daily · 公众号 · 科技自媒体 · 2025-02-06 20:51

主要观点总结

本文主要报道了关于人工智能领域的新模型s1的训练方法和其背后的技术原理。s1模型是基于阿里云通义千问模型进行监督微调而成，其低成本训练方式引发了广泛关注。文章介绍了s1模型的关键技术点，包括其基于开源基础模型的训练、低成本实现以及局限性。

关键观点总结

关键观点1: s1模型的训练基于阿里云通义千问模型进行微调

s1模型不是从零开始训练的，而是利用了已有的强大基座模型——阿里云通义千问模型，通过监督微调的方式达到推理能力。

关键观点2: s1模型的“低成本”建立在开源基础模型之上

s1模型利用开源基础模型的强大能力，以极低的成本（50美元）成功训练出具备推理能力的模型。

关键观点3: s1模型的训练依赖于大量的样本数据

虽然s1模型使用的样本数据量相对较小（1000个），但在训练过程中，这些样本数据起到了重要的作用，被认为是“锦上添花”的因素。

关键观点4: 低成本训练新模型有局限性

低成本训练新模型的局限性包括依赖已有的强大基座模型、样本数据量不足以及可能引发的知识产权和伦理问题。

关键观点5: s1模型的训练思路为AI领域提供新的方向

尽管存在局限性，但s1模型的训练思路为AI领域提供了新的思考方向，如何在保证模型性能的前提下降低训练成本是AI研究的重要课题。

文章预览

s1模型的训练并非从零开始，而是基于阿里云通义千问（Qwen）模型进行监督微调。s1模型的神奇“低成本”，是建立在已具备强大能力的开源基础模型之上，可谓依然是开源的胜利。作者 | 毛明江黄心怡今日一则关于人工智能领域的新闻引发广泛关注。据报道，李飞飞等斯坦福大学和华盛顿大学的研究人员以不到50美元的云计算费用，成功训练出了一个名为s1的人工智能推理模型。该模型在数学和编码能力测试中的表现，据称与OpenAI的O1和DeepSeek的R1等尖端推理模型不相上下。这一消息无疑在AI界投下了一颗重磅炸弹，真相究竟如何？《科创板日报》记者调查和采访业内人士后发现，s1模型的训练并非从零开始，而是基于阿里云通义千问（Qwen）模型进行监督微调。这意味着，s1模型的神奇“低成本”，是建立在已具备强大能力的开源基础模型之上。 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

天府生活派 · 疯！成都地价创新高，房价5W+？

昨天

天府生活派 · 疯！成都地价创新高，房价5W+？

昨天

屹起会 · 平台纷纷“讨好”商家，拼多多再次加码！

2 天前

屹起会 · 平台纷纷“讨好”商家，拼多多再次加码！

2 天前

sven_shi · 房屋养老金的问题可以做个参考。房屋养老金：房产估值的新困境 -20250309225728

3 天前

科技日报 · 达到国际先进水平！这一关键系统验收

3 天前

科技日报 · 达到国际先进水平！这一关键系统验收

3 天前

896汽车调频 · 刘亦菲，传来新消息！

3 天前

896汽车调频 · 刘亦菲，传来新消息！

3 天前

亿邦动力 · 视频号升级私域激励计划商家单周最高可获15万流量点；9月1日起天猫将全面取消年费，已支付部分将按规则返还丨零售电商周报

7 月前

半月谈 · 蹊跷！电脑“自己偷偷建群”，还拉黑了老板?

6 月前

观南昌360 · 高达3亿！拿地数年未开发！九龙湖西地铁口地块要拍卖了！！

6 月前

数据行者X · 报告 | 《中国城市治理数字化转型报告——创新推动一网统管“民意速办”》（附下载）

4 月前

IT之家 · 【神评】不会又是工程机特调SoC+特调运存+冰箱跑分吧

2 月前