文章预览
“Meta的生成式AI部门正处于恐慌中。这一切始于 Deepseek,它使得 Llama 4 在基准测试中已经落后。雪上加霜的是: 那个不知名的中国公司,仅有 550 万美元的训练预算 。工程师们正在疯狂地剖析 Deepseek,并试图从中复制一切可能的东西……” 一位Meta的工程师在美国科技公司员工社区Blind中这样写道。 5天前,中国的一家AI大模型创业公司DeepSeek(深度求索)正式发布 DeepSeek-R1大模型。在发布声明中,DeepSeek表示, DeepSeek-R1在数学、代码、自然语言推理等任务上,性能比肩 OpenAI o1 正式版 。这一消息震动了全球AI圈。 例如,在AIME 2024数学基准测试中, DeepSeek-R1的得分率为79.8%,而OpenAI-o1的得分率为79.2% 。在MATH-500基准测试中,DeepSeek-R1的得分率为97.3%,而OpenAI-o1的得分率为96.4%。在编码任务中,DeepSeek-R1超过了96.3%的人类选手,而o1是96.6%。 这个来自中国的
………………………………