今天看啥  ›  专栏  ›  未尽研究

DeepSeek的三场英伟达GTC秀

未尽研究  · 公众号  ·  · 2025-02-15 23:12
    

文章预览

最早赏识DeepSeek的巨头,可能就是英伟达了。在ChatGPT尚未诞生的2022年春天,幻方AI(High-Flyer AI,相当于DeepSeek的前身)就受邀在黄仁勋的GTC舞台上演讲,一连请了三年。 被DeepSeek“伤”得最深的巨头,恐怕也就是英伟达了。不说推理模型R1 一夜砸掉了英伟达6000亿美元市值 ,在DeepSeek的论文里,这家几乎垄断了全球AI算力供应的芯片巨头,也是被“抱怨”和“建议”的对象。如果不从头到尾改一遍,老黄家的算力还是太贵了,并非他吆喝的“买得越多,省得越多”。 去年底至今,DeepSeek的基础模型V3与推理模型R1,以其高性比价优势, 震惊了美国硅谷、华尔街与华盛顿 ,也 激活了国内AI生态的国产替代 。EpochAI连续写了两篇文章分析DeepSeek如何改进transformer及其训练,称从事后来看一切都如此“显而易见”,但绝不意味着一开始想出这些点子是件容易 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览