文章预览
来源:内容由半导体行业观察(ID:icbank)转自知乎,作者:高洋。 图片来源:由无界AI生成 毫无疑问,GPU和AI加速器才是AI时代算力的最大提供者。训练AI模型需要GPU的超大算力,但一块GPU越来越存不下今天的模型,互联多块GPU成了刚需,各种高端的网卡,DPU也诞生了。推理AI模型也需要非常高的算力,同时对存储带宽的要求也越来越高。即便是端侧,这几年移动GPU和NPU的进步,AI的部署也大多从CPU侧迁移到更大算力,更高能效的模块中。一切都在向着异构 + 专有结构的方向发展。 CPU这个曾经的通用计算王者现在面临很尴尬的处境:往往沦为大型AI负载的调度器和数据搬运工具,还要承担加速器处理不了的长尾需求,被吐槽拖慢了整体速度。然而各家CPU厂商总要生存,他们近几年也陆陆续续在自家CPU上引入AI的加速功能,以期能在这个言必称AI的市
………………………………