专栏名称: 电子发烧友网
关注电子发烧友网,即时收听电子行业动态,抢先知晓半导体行业发生的最新事件。
今天看啥  ›  专栏  ›  电子发烧友网

万卡集群解决大模型训算力需求,建设面临哪些挑战

电子发烧友网  · 公众号  ·  · 2024-06-02 00:00
    

文章预览

电子发烧友网报道(文/李弯弯)万卡集群是指由一万张及以上的加速卡(包括GPU、TPU及其他专用AI加速芯片)组成的高性能计算系统,主要用于加速人工智能模型的训练和推理过程。这种集群的构建旨在解决大模型训练对算力需求的巨大增长问题,尤其是现在模型参数量从百亿级、千亿级迈向万亿级。 国内外企业积极构建万卡集群 目前,在国际上,包括微软、Google、Meta等AI领域的巨头,都已落子超万卡集群的项目部署。如Meta于2022年推出了拥有16000张算卡的超级集群中心;Google于2023年推出了一个拥有2.6万张算卡的Compute Engine A3;而持有OpenAI的微软更是传出正在进行百万规模算卡集群的筹建。 不只是国际厂商,国内厂商也在此前大量采购GPU推进万卡集群建设。尤其在今年以来,三大运营商也相继公布了对超万卡集群的部署。 近日,在中国移动算力 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览