专栏名称: 合纵投研
合纵百业,连结你我。如有侵权后台联系删除!
今天看啥  ›  专栏  ›  合纵投研

ASIC专家交流纪要

合纵投研  · 公众号  ·  · 2024-12-15 23:48
    

主要观点总结

本文介绍了GPU与定制AI ASIC芯片对比、AI加速器发展方向、AI模型性能相关情况、GPU利用率及相关问题、训练与推理相关情况等内容。

关键观点总结

关键观点1: GPU与定制AI ASIC芯片对比

定制AI ASIC芯片更适合AI工作负载,其内存架构能够解决GPU中的挑战,并在通用性和特异性之间取得平衡。

关键观点2: AI加速器发展方向

AI加速器的开发正在超大规模数据中心运营商、无晶圆厂半导体公司和老牌半导体公司三个领域推进,其采用曲线将比GPU快得多。

关键观点3: AI模型性能相关情况

AI模型性能提升正在趋于平稳,出现收益递减的情况,当前追求的关键目标包括提高每秒标记数、减少首个标记的生成时间以及提高基于思维链推理的准确性。

关键观点4: GPU利用率及相关问题

目前GPU的利用率受到内存限制,定制AI加速器能够避开这些限制,例如将RAM置于处理器内部或采用数字内存内计算解决方案。

关键观点5: 训练与推理相关情况

由于训练成本极高,只有超大规模数据中心运营商才有能力专注于训练。未来几年,随着各方关注可部署性和营收机会,推理的采用率将会提高。


文章预览

GPU与定制AI ASIC芯片 对比: 专家指出,虽然图形处理器(GPU)非常适用于通用的高计算量应用,但定制AI ASIC芯片更适合AI工作负载。这是因为AI ASIC的硅片设计采用了全新方法,其内存架构能够解决GPU中可能出现的挑战,并且它们能够在通用性和特异性之间取得平衡。AI工作负载涉及复杂的多维矩阵乘法,而AI ASIC对此进行了优化。 AI加速器发展方向: AI加速器的开发正在三个领域推进:超大规模数据中心运营商(如谷歌,自2015年开始开发张量处理单元TPU)、新兴的无晶圆厂半导体公司(如Tenstorrent、Groq和Cerebras,采用全新的硅片设计方法)以及老牌半导体公司(如博通和美满电子)。AI加速器的采用曲线将比GPU快得多,并且已有证据表明其性能远超GPU(例如,d-Matrix每秒可处理多达6万个标记,Groq在近期性能基准测试中比英伟达GPU快10-15倍)。异构计 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览