专栏名称: 新智元
智能+中国主平台,致力于推动中国从互联网+迈向智能+新纪元。重点关注人工智能、机器人等前沿领域发展,关注人机融合、人工智能和机器人革命对人类社会与文明进化的影响,领航中国新智能时代。
今天看啥  ›  专栏  ›  新智元

DeepSeek绕开CUDA垄断,V3论文细节再挖出!英伟达护城河不存在了?

新智元  · 公众号  · AI  · 2025-01-29 13:14
    

文章预览

   新智元报道   编辑:桃子 好困 【新智元导读】 DeepSeek模型开发竟绕过了CUDA?最新爆料称,DeepSeek团队走了一条不寻常的路——针对英伟达GPU低级汇编语言PTX进行优化实现最大性能。业界人士纷纷表示,CUDA护城河不存在了? 原本DeepSeek低成本训出的R1,就已经让整个硅谷和华尔街为之虎躯一震。 而现在又曝出,打造这款超级AI,竟连CUDA也不需要了? 根据外媒的报道,他们在短短两个月时间,在2,048个H800 GPU集群上,训出6710亿参数的MoE语言模型,比顶尖AI效率高出10倍。 这项突破不是用CUDA实现的,而是通过大量细粒度优化以及使用英伟达的类汇编级别的PTX(并行线程执行)编程。 这则消息一出,再次掀翻AI圈,网友对其策略纷纷表示震惊: 「在这个世界上,如果有哪群人会疯狂到说出『CUDA太慢了!干脆直接写PTX吧!』这种话,绝对就是那些前 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览