文章预览
天风计算机团队 作者 | 缪欣 君 联系人 | 刘鉴 李航 摘要 算力是衡量计算机处理信息能力的重要指标 , 其中 AI 算力专注于 AI 应用,常见单位为 TOPS 和 TFLOPS ,通过 GPU 、 ASIC 、 FPGA 等专用芯片提供算法模型训练和推理。算力精度作为衡量算力水平的一种方式,其中 FP16 、 FP32 应用于模型训练, FP16 、 INT8 应用于模型推理。 AI 芯片通常采用 GPU 和 ASIC 架构。 GPU 因其在运算和并行任务处理上的优势成为 AI 计算中的关键组件,它的算力和显存、带宽决定了 GPU 的运算能力。 GPU 的核心可分为 CudaCore 、 Tensor
Core 等; T ensor
Core 是增强 AI 计算的核心, 相较于并行计算表现卓越的 CudaCore ,它更专注于深度学习领域,通过优化矩阵运算来加速 AI 深度学习的训练和推理任务,其中 Nvidia Volta Tensor Core 架构较 Pascal 架构( Cuda Core) 的 AI 吞吐量增加了 12 倍
………………………………