硅谷恐慌！来自中国的大模型成最大黑马，成本仅国外三十分之一......

INSIGHT视界 · 公众号 · · 2025-01-26 22:00

文章预览

“Meta的生成式AI部门正处于恐慌中。这一切始于 Deepseek，它使得 Llama 4 在基准测试中已经落后。雪上加霜的是：那个不知名的中国公司，仅有 550 万美元的训练预算。工程师们正在疯狂地剖析 Deepseek，并试图从中复制一切可能的东西……” 一位Meta的工程师在美国科技公司员工社区Blind中这样写道。 5天前，中国的一家AI大模型创业公司DeepSeek（深度求索）正式发布 DeepSeek-R1大模型。在发布声明中，DeepSeek表示， DeepSeek-R1在数学、代码、自然语言推理等任务上，性能比肩 OpenAI o1 正式版。这一消息震动了全球AI圈。例如，在AIME 2024数学基准测试中， DeepSeek-R1的得分率为79.8%，而OpenAI-o1的得分率为79.2% 。在MATH-500基准测试中，DeepSeek-R1的得分率为97.3%，而OpenAI-o1的得分率为96.4%。在编码任务中，DeepSeek-R1超过了96.3%的人类选手，而o1是96.6%。这个来自中国的 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博