DeepSeek创始人专访：中国的AI不可能永远跟随，需要有人站到技术的前沿

Founder Park · 公众号 · 科技创业 AI · 2025-01-08 18:03

主要观点总结

DeepSeek 是一家专注于研究通用人工智能（AGI）的公司，通过其开源模型 V3 和 V2 实现了突破性的技术创新。这些模型在性能上超越了其他开源模型，并在价格上极具竞争力。DeepSeek 创始人梁文锋强调原创式创新的重要性，并坚持只做研究和探索，不追求短期商业化。他相信，中国也需要参与到全球创新的浪潮中，推动整个生态的发展。DeepSeek 在招聘、管理和研究过程中都遵循着一种创新的、非传统的模式，并致力于打造一种支持创新的文化。

关键观点总结

关键观点1: DeepSeek 的技术创新

DeepSeek 通过其开源模型 V3 和 V2 实现了突破性的技术创新，在性能和价格上都具有竞争力，超越了其他开源模型，并在 Chatbot Arena 大模型排行榜上排名第七。

关键观点2: 原创式创新的重要性

DeepSeek 创始人梁文锋强调原创式创新的重要性，并坚持只做研究和探索，不追求短期商业化。他相信，只有参与到全球创新的浪潮中，中国才能成为真正的贡献者。

关键观点3: 招聘、管理和研究的创新模式

DeepSeek 在招聘、管理和研究过程中都遵循着一种创新的、非传统的模式。它选择没有经验但基础能力强、有创造性和热爱的人才，并通过一种松散的管理方式支持创新。

关键观点4: 打造支持创新的文化

DeepSeek 致力于打造一种支持创新的文化，通过减少干预和管理，让每个人有自由发挥的空间和试错机会。创始人相信，创新往往是自己产生的，不是刻意安排的，更不是教出来的。

关键观点5: 对 AGI 的愿景

DeepSeek 致力于实现通用人工智能（AGI），并相信 AGI 将在未来实现。创始人对实现 AGI 的过程持乐观态度，并认为这会带来基础模型和基础服务的专业化分工，满足社会的多样化需求。

文章预览

因为 V3 版本开源模型的发布，DeepSeek 又火了一把，而且这一次，是外网刷屏。训练成本估计只有 Llama 3.1 405B 模型的 11 分之一，后者的效果还不如它。在多项测评上，DeepSeek V3 达到了开源 SOTA，超越 Llama 3.1 405B，能和 GPT-4o、Claude 3.5 Sonnet 等 TOP 模型正面掰掰手腕——而其价格比 Claude 3.5 Haiku 还便宜，仅为 Claude 3.5 Sonnet 的 9%。在 Chatbot Arena 大模型排行榜上排名第 7，前十名里面，只有它是开源模型，而且是最少限制的 MIT 许可证。 2024 年 5 月，DeepSeek 一跃成名。起因是他们发布的一款名为 DeepSeek V2 的开源模型，提供了一种史无前例的性价比，开启了国产大模型的价格战。作为大厂外唯一一家储备万张 A100 芯片的公司，DeepSeek 的很多抉择都与众不同。放弃「既要又要」路线，至今专注在研究和技术，未做 toC 应用的公司，也是唯一一家未全面考虑商 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博