专栏名称: 果壳
果壳网(Guokr.com)是开放、多元的泛科技兴趣社区。
今天看啥  ›  专栏  ›  果壳

来自中国的大模型成最大黑马,成本仅国外三十分之一,硅谷恐慌

果壳  · 公众号  · 科学  · 2025-01-28 20:00
    

文章预览

图源:pixabay 撰文 | 张天祁 李珊珊 “Meta的生成式AI部门正处于恐慌中。这一切始于 Deepseek,它使得 Llama 4 在基准测试中已经落后。雪上加霜的是:那个不知名的中国公司,仅有 550 万美元的训练预算。工程师们正在疯狂地剖析 Deepseek,并试图从中复制一切可能的东西……” 一位Meta的工程师在美国科技公司员工社区Blind中这样写道。 5天前,中国的一家AI大模型创业公司DeepSeek(深度求索)正式发布 DeepSeek-R1大模型。在发布声明中,DeepSeek表示, DeepSeek-R1在数学、代码、自然语言推理等任务上,性能比肩 OpenAI o1 正式版。这一消息震动了全球AI圈。 例如,在AIME 2024数学基准测试中,DeepSeek-R1的得分率为79.8%,而OpenAI-o1的得分率为79.2%。在MATH-500基准测试中,DeepSeek-R1的得分率为97.3%,而OpenAI-o1的得分率为96.4%。在编码任务中,DeepSeek-R1超过了96.3%的人类选手 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览