专栏名称: GiantPandaCV
专注于机器学习、深度学习、计算机视觉、图像处理等多个方向技术分享。团队由一群热爱技术且热衷于分享的小伙伴组成。我们坚持原创,每天一到两篇原创技术分享。希望在传播知识、分享知识的同时能够启发你,大家一起共同进步(・ω<)☆
目录
相关文章推荐
GiantPandaCV  ·  NVIDIA Nemotron-4 ...·  4 天前  
GiantPandaCV  ·  NVIDIA Nemotron-4 ...·  4 天前  
GiantPandaCV  ·  MLIR_对自定义IR ...·  3 天前  
今天看啥  ›  专栏  ›  GiantPandaCV

窥探Triton的lower(二)

GiantPandaCV  · 公众号  · 3D  · 2024-06-23 00:00
作者丨液态黑洞来源丨https://zhuanlan.zhihu.com/p/695255185编辑丨GiantPandaCV在第一章我们已经完成了源码到make_ir的大致过程的分析,通过处理AST得到了初始的ttir。在这一章,我们会继续往下走,完成最后一步compile_ir。我们编译的后端nvptx又将这一步分为了五个小阶段:make_ttir、make_ttgir、make_llir、make_ptx和make_cubin,其中后两个阶段借助llvm和nv的ptxas完成,因此我们主要关注前面三个阶段。这些阶段由多个pass组合而成(这里默认读者知晓了编译器中"pass"的含义和作用), 根据pass的来源,我们可以发现它们大致可以分为下面几种common,定义在mlir/include/mlir/Transforms/Passes.tdttir,定义在triton/include/triton/Dialect/Triton/Transforms/Passes.tdttgpuir,定义在triton/include/triton/Dialect/TritonGPU/Transforms/Passes.tdttnvgpuir,定义在triton/include/triton/Dialect/TritonNvidiaGPU/Transforms/Passes.td它们都通 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照