文章预览
选自 tanishq.ai 作者:Tanishq Mathew Abraham 机器之心编译 围绕 DeepSeek 的谣言实在太多了。 面对 DeepSeek R1 这个似乎「一夜之间」出现的先进大模型,全世界已经陷入了没日没夜的大讨论。从它的模型能力是否真的先进,到是不是真的只用了 550W 进行训练,再到神秘的研究团队,每个角度都是话题。 虽然 R1 是开源的,围绕 DeepSeek 的各种夸张猜测还是层出不穷,有人说训练 R1 实际上使用的算力远超论文所说的,有人质疑 R1 的技术创新,甚至还有人说 DeepSeek 实际的目标是做空…… 近日,知名生成式 AI 创业公司 Stability AI 的前研究主管 Tanishq Abraham 终于坐不住了,他撰文揭穿了围绕 DeepSeek 的一系列谬论。 行文直接了当,让人很快就可以了解实际情况。让我们看看海外一线 AI 研究者是怎么说的。 今年 1 月 20 日,DeepSeek 开源的强推理模型 R1 震撼了世人,与
………………………………