ASIC专家交流纪要

合纵投研 · 公众号 · · 2024-12-15 23:48

主要观点总结

本文介绍了GPU与定制AI ASIC芯片对比、AI加速器发展方向、AI模型性能相关情况、GPU利用率及相关问题、训练与推理相关情况等内容。

关键观点总结

关键观点1: GPU与定制AI ASIC芯片对比

定制AI ASIC芯片更适合AI工作负载，其内存架构能够解决GPU中的挑战，并在通用性和特异性之间取得平衡。

关键观点2: AI加速器发展方向

AI加速器的开发正在超大规模数据中心运营商、无晶圆厂半导体公司和老牌半导体公司三个领域推进，其采用曲线将比GPU快得多。

关键观点3: AI模型性能相关情况

AI模型性能提升正在趋于平稳，出现收益递减的情况，当前追求的关键目标包括提高每秒标记数、减少首个标记的生成时间以及提高基于思维链推理的准确性。

关键观点4: GPU利用率及相关问题

目前GPU的利用率受到内存限制，定制AI加速器能够避开这些限制，例如将RAM置于处理器内部或采用数字内存内计算解决方案。

关键观点5: 训练与推理相关情况

由于训练成本极高，只有超大规模数据中心运营商才有能力专注于训练。未来几年，随着各方关注可部署性和营收机会，推理的采用率将会提高。

文章预览

GPU与定制AI ASIC芯片对比：专家指出，虽然图形处理器（GPU）非常适用于通用的高计算量应用，但定制AI ASIC芯片更适合AI工作负载。这是因为AI ASIC的硅片设计采用了全新方法，其内存架构能够解决GPU中可能出现的挑战，并且它们能够在通用性和特异性之间取得平衡。AI工作负载涉及复杂的多维矩阵乘法，而AI ASIC对此进行了优化。 AI加速器发展方向： AI加速器的开发正在三个领域推进：超大规模数据中心运营商（如谷歌，自2015年开始开发张量处理单元TPU）、新兴的无晶圆厂半导体公司（如Tenstorrent、Groq和Cerebras，采用全新的硅片设计方法）以及老牌半导体公司（如博通和美满电子）。AI加速器的采用曲线将比GPU快得多，并且已有证据表明其性能远超GPU（例如，d-Matrix每秒可处理多达6万个标记，Groq在近期性能基准测试中比英伟达GPU快10-15倍）。异构计 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博