文章预览
【点击】 加入大模型技术交流群 原文:https://zhuanlan.zhihu.com/p/679525399 写在前面 GPGPU 的概念已经很火了,了解GPGPU的架构、功能对于我们优化AI 框架性能、国产自主研发AI芯片会有益处,所以我们在这对GPGPU 尝试做一个稍微全面的overview。 理解GPU的基础 定位 对CPU的评价 Easy to program:compilers evolved right along with the hardware they run on. Software developers can ignore most of the complexity in modern CPUs; microarchitecture is almost invisible, and compiler magic hides the rest. optimized for single-threaded performance,not parallel execution。 从板上设计看,cpu 大部分的面积用于指令decoder(包括寻址、取指、优化等等)与cache、分支预测上,整数计算和浮点计算写对面积却很少。 不适合于HPC 大数据量运算的情况。 Speculation execution depends on high data locality、a mix of different operations and high percentage of conditional b
………………………………