专栏名称: 硅星人Pro
硅(Si)是创造未来的基础,欢迎来到这个星球。
今天看啥  ›  专栏  ›  硅星人Pro

DeepSeek-V3:美国芯片封锁的“意外”产物?

硅星人Pro  · 公众号  · 科技媒体  · 2025-01-03 09:49
    

文章预览

作者 | 周一笑 邮箱 | zhouyixiao@pingwest.com 继电动车、消费品之后,中国团队又在AI领域上演了一出“成本屠夫”的好戏。 用两个月、600万美元,就能训出一个能跟ChatGPT掰手腕的AI模型?Deepseek用实力演绎了“四两拨千斤”是什么意思。 幻方量化旗下的DeepSeek公司宣布发布全新系列模型DeepSeek-V3首个版本,并同步开源。他们仅用2048块H800显卡、耗时两个月,就训出了一个6710亿参数的DeepSeek-V3。相较于Meta训练参数量4050亿的Llama 3,用了16,384块更强的H100显卡,花了54天。Deepseek的训练效率提升了11倍。 这事儿一出,连CNBC都坐不住了。在最新报道中,记者亲自上手测试后惊呼:“这模型的能力完全能和OpenAI掰手腕”。 DeepSeek-V3在技术圈收获的关注和讨论,堪比游戏界的《黑神话:悟空》,其影响力甚至让OpenAI CEO奥特曼坐不住了,发推特暗戳戳说“复制总比 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览