专栏名称: 吃果冻不吐果冻皮
专注于AI工程化(LLM、MLOps、LLMOps、RAG、Agent)落地。
今天看啥  ›  专栏  ›  吃果冻不吐果冻皮

NVIDIA GPGPU 总览

吃果冻不吐果冻皮  · 公众号  ·  · 2024-07-03 12:00

文章预览

【点击】 加入大模型技术交流群 原文:https://zhuanlan.zhihu.com/p/679525399 写在前面 GPGPU 的概念已经很火了,了解GPGPU的架构、功能对于我们优化AI 框架性能、国产自主研发AI芯片会有益处,所以我们在这对GPGPU 尝试做一个稍微全面的overview。 理解GPU的基础 定位 对CPU的评价 Easy to program:compilers evolved right along with the hardware they run on. Software developers can ignore most of the complexity in modern CPUs; microarchitecture is almost invisible, and compiler magic hides the rest. optimized for single-threaded performance,not parallel execution。 从板上设计看,cpu 大部分的面积用于指令decoder(包括寻址、取指、优化等等)与cache、分支预测上,整数计算和浮点计算写对面积却很少。 不适合于HPC 大数据量运算的情况。 Speculation execution depends on high data locality、a mix of different operations and high percentage of conditional b ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览