专栏名称: 财联社AI daily
财联社及科创板日报旗下产品 ,聚焦TMT领域,更独家、更深度。
今天看啥  ›  专栏  ›  财联社AI daily

华为云上线“核弹级产品” 高功耗或对散热提出考验

财联社AI daily  · 公众号  · 科技自媒体  · 2025-04-14 21:11
    

主要观点总结

华为公布了AI基础设施架构的新进展,推出了CloudMatrix 384超节点,并在芜湖数据中心规模上线。华为内部人士将其称为核弹级产品,旨在解决算力焦虑。该超节点可以构建超过万片的大集群提供算力,性能与可靠性对标英伟达NVL72超节点。此外,硅基流动联合华为云基于CloudMatrix 384超节点推出了DeepSeek-R1,取得了良好的模型精度和性能表现。然而,国产芯片在单位算力功耗方面仍高于英伟达芯片,需要关注散热和整体成本问题。

关键观点总结

关键观点1: 华为推出CloudMatrix 384超节点

华为近日公布了AI基础设施架构的新进展,并推出了CloudMatrix 384超节点,在芜湖数据中心规模上线。该超节点使用昇腾算力卡组成,是目前已商用的超节点中规模最大的。

关键观点2: CloudMatrix 384超节点的性能与可靠性

华为CloudMatrix 384超节点在性能与可靠性方面对标英伟达的NVL72超节点。基于CloudMatrix的昇腾AI云服务,大模型训练作业可稳定运行40天,互联带宽断点恢复在10秒级别。

关键观点3: 硅基流动与华为的合作

硅基流动联合华为云基于CloudMatrix 384超节点昇腾云服务上线了DeepSeek-R1,其性能表现良好,模型精度与DeepSeek官方保持一致。此外,国产芯片与英伟达芯片在单卡性能方面仍存在一定差距,但通过多卡集群后差距会缩小。

关键观点4: 单位算力功耗问题

国产芯片在单位算力功耗方面仍高于英伟达芯片。这涉及到服务器散热和整体成本问题,需要关注并采取相应的解决方案。

关键观点5: 行业巨头的竞争与挑战

随着大模型浪潮的到来,行业巨头需要连接起成千上万的GPU算力卡,这对互联和通信提出了更高的要求。华为推出CloudMatrix 384超节点体现了其强大的研发能力,但也需要面对功耗和成本等挑战。


文章预览

文|黄心怡 近日,华为公布了AI基础设施架构的新进展,推出CloudMatrix 384超节点,并已在芜湖数据中心规模上线。《科创板日报》独家了解到 ,华为云CloudMatrix384超节点今年上半年将有数万规模的上线。华为内部人士称其为核弹级的产品,或将彻底终结算力焦虑。未来,CloudMatrix超节点可以构建超过万片的大集群来提供算力。 传统的AI服务器通常包括8张算力卡,一台服务器就称为一个节点。在服务器内部,这8张算力卡之间传输速度很快,但服务器与服务器之间的传输速度则慢得多。伴随大模型浪潮的到来,行业巨头需要连接起成千上万、乃至10万计的GPU算力卡,这使得互联和通信成了一个大麻烦。 如果能够采用高速通信技术把更多的算力卡融合在一起,成为一个超节点,那么超节点内的算力卡都可以实现高速互联和通信,就能大大提升算力集群的 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览