分享最新一线AI大模型、云原生、智能算力架构技术
今天看啥  ›  专栏  ›  AI云原生智能算力架构

AI大模型训练-智能无损网络技术深度分析(第四篇)2024

AI云原生智能算力架构  · 公众号  ·  · 2024-09-03 07:15

文章预览

    AI大模型训练-智能无损网络技术深度分析(共四篇) 4  智能无损存储网络技术( iNOF ) 4.1 iNOF 简介 随着全球企业数字化转型的加速进行,互联网应用在生产、生活领域的不断深入,存储网络的规模 越来越大,需要处理的数据越来越多,总部和分支机构的数据中心部署在不同的物理位置, RDMA ( Remote Direct Memory Access ,远程直接内存访问功能)成为存储网络的主流技术。 RDMA  利用相关的硬件和网络技术,使主机的网卡之间可以直接读内存,最终达到高带宽、低时延和低资源消耗率的效果。 然而, RDMA  提出之初是承载在无损的  IB ( Infinite Band ,无限带宽)网络中的,专用的  IB  网络架构封闭,无法兼容现网,使用成本较高,于是, RoCE ( RDMA over Converged Ethernet )应运而生。 RoCE  使用以太网承载  RDMA  的网络协议,有两个版本: RoCEv1  ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览