专栏名称: CloudAI Sphere
专注大数据和云计算技术,坚持原创,欢迎和各位业界朋友相互交流和学习。 我们坚持:有深度,技术追根溯源;有态度,无关乎对错。
今天看啥  ›  专栏  ›  CloudAI Sphere

2024 云栖大会第二天之基础设施

CloudAI Sphere  · 公众号  ·  · 2024-10-05 07:00
    

文章预览

阿里云最大规模是基础设施这一块。以前是蒋江伟管(花名小邪),这次出来的是吴结生,原来负责存储,现在开始新 title 是计算和存储产品线负责人。 小邪不知道负责什么去了,有知道的同学私信我一下。 接下来看下吴结生讲解的,基础设施这块主要的变化是什么。 下面是正文: 云计算帮助企业从数据往数据+AI 转变。 小红书的案例 AI 对算力指数级增长,每年增长 4~5 倍。 对存储也是指数级的增长 分三个方面,大规模、高性价比;高性能、高可用;更易用、更智能把产品更新和发布串起来讲。 全栈基础设施 大规模 GPU 集群,最大 10 万张卡。 快评:10 万有点虚,我理解是系统设计上限,并不是物理真实存在。 新的高性能网络。 单台服务器支持 8 卡或者 16 卡 GPU 并行文件系统 快评:是 OEM 的 IBM的 GPFS,还是全自研的?有知道的告诉我一下。 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览