文章预览
阿里云最大规模是基础设施这一块。以前是蒋江伟管(花名小邪),这次出来的是吴结生,原来负责存储,现在开始新 title 是计算和存储产品线负责人。 小邪不知道负责什么去了,有知道的同学私信我一下。 接下来看下吴结生讲解的,基础设施这块主要的变化是什么。 下面是正文: 云计算帮助企业从数据往数据+AI 转变。 小红书的案例 AI 对算力指数级增长,每年增长 4~5 倍。 对存储也是指数级的增长 分三个方面,大规模、高性价比;高性能、高可用;更易用、更智能把产品更新和发布串起来讲。 全栈基础设施 大规模 GPU 集群,最大 10 万张卡。 快评:10 万有点虚,我理解是系统设计上限,并不是物理真实存在。 新的高性能网络。 单台服务器支持 8 卡或者 16 卡 GPU 并行文件系统 快评:是 OEM 的 IBM的 GPFS,还是全自研的?有知道的告诉我一下。
………………………………