文章预览
数十年来,传统的云算力中心一直专注于为广泛的用户群提供各种资源。 基础设施组件虚拟化方面的进步使系统和应用程序能够根据需要快速部署,以满足需求。这些算力中心非常适合支持各种业务的应用程序,且通过企业级以太网连接就足以支持小规模工作负载。 虽然以太网包含了广泛和全面的功能集,但它的性能无法保证大规模应用。它也不适合高性能计算。 如今,我们面临着新型算力中心的崛起:Al 云和 A工厂,它们需要加速计算和高性能网络来支持人工智能 (AI)。 因此,当今的超大规模算力中心的部署格局正在发生巨大变化。随着 GPU 加速计算架构的广泛应用, Al研究人员和从业者可以利用分布式加速计算的强大功能,若没有高性能网络的支持,这样大规模的高性能计算将是不可想象的。 因为算力中心进行分布式AI模型训练和生成式Al,这需要强
………………………………