专栏名称: Datawhale

一个专注于AI领域的开源组织，汇聚了众多顶尖院校和知名企业的优秀学习者，聚集了一群有开源精神和探索精神的团队成员。愿景-for the learner，和学习者一起成长。

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

DeepSeek创始人专访：中国的AI不可能永远跟随，需要有人站到技术的前沿

Datawhale · 公众号 · · 2025-01-10 19:30

文章预览

Datawhale分享来源：暗涌Waves，整理： Founder Park 因为 V3 版本开源模型的发布，DeepSeek 又火了一把，而且这一次，是外网刷屏。训练成本估计只有 Llama 3.1 405B 模型的 11 分之一，后者的效果还不如它。在多项测评上，DeepSeek V3 达到了开源 SOTA，超越 Llama 3.1 405B，能和 GPT-4o、Claude 3.5 Sonnet 等 TOP 模型正面掰掰手腕——而其价格比 Claude 3.5 Haiku 还便宜，仅为 Claude 3.5 Sonnet 的 9%。在 Chatbot Arena 大模型排行榜上排名第 7，前十名里面，只有它是开源模型，而且是最少限制的 MIT 许可证。 2024 年 5 月，DeepSeek 一跃成名。起因是他们发布的一款名为 DeepSeek V2 的开源模型，提供了一种史无前例的性价比，开启了国产大模型的价格战。作为大厂外唯一一家储备万张 A100 芯片的公司，DeepSeek 的很多抉择都与众不同。放弃「既要又要」路线，至今专注在研究和技术， ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博