文章预览
近日,高性能计算与人工智能协同创新国际论坛(HACI)在广东深圳举办,中国电信科技委主任邵广禄应邀出席会议,分享了中国电信在智算集群和网络方面的实践与思考。 “算力是人工智能发展的重要驱动力,影响着大模型的迭代和创新的速度,也影响着经济发展的速度。”邵广禄介绍,在智算方面,中国电信重点推进两项工作,一是建成大规模智算集群,目前上海、北京两个万卡集群已经投产。面向AI大模型训练的智算集群,需要从IDC向AIDC升级,重点围绕模型算力利用率(MFU),线性加速比、稳定性、时延、丢包率、GPU利用率等六大关键指标,持续开展智算集群的设计、建设、运营、优化等工作,提高大模型训练的效率效能。二是用智算网络和算力调度平台实现全国算力资源的互联互通,按需调用,自研“息壤”算力调度平台,已实现全国21EFl
………………………………