人工智能产业链核心:基础技术、人工智能技术及人工智能应用。 服务机器人核心:芯片、操作系统、AI技术。 工业机器人核心:减速器、伺服机、控制器。 无人机核心:控制、环境感知、路径规划。 无人驾驶汽车核心计算机科学、模式识别、智能控制技术。
今天看啥  ›  专栏  ›  人工智能产业链union

【半导体】谷歌撰文,深度剖析TPU

人工智能产业链union  · 公众号  ·  · 2025-02-07 20:20
    

文章预览

  芯片项目组创始团队招募!◀ 点击查看! 关于 TPU 的工作原理、它们如何联网以实现多芯片训练和推理,以及它们如何限制我们最喜欢的算法的性能。虽然这看起来有点枯燥,但对于真正提高模型效率来说,它非常重要。 什么是TPU? TPU 基本上是一个专门用于矩阵乘法的计算核心(称为 TensorCore),连接到一堆快速内存(称为高带宽内存或 HBM),以下是图表: 图:TPU 芯片的基本组件。TensorCore 是左侧灰色框,包含矩阵乘法单元 (MXU)、矢量单元 (VPU) 和矢量内存 (VMEM)。 您可以将 TensorCore 视为一款出色的矩阵乘法机,但它还有一些其他值得注意的功能。TensorCore 有三个关键单元: MXU (矩阵乘法单元)是 TensorCore 的核心。对于大多数 TPU 代,它执行一次矩阵bfloat16[8,128] @ bf16[128,128] -> f32[8,128]乘法1每 8 个周期使用一个脉动阵列。 在 TPU v5e 上,1.5GHz 时 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览