深入解读tensorRT-LLM的关键技术 (未完待续)

oldpan博客 · 公众号 · · 2024-10-14 19:14

文章预览

借着诺贝尔物理学奖和化学奖颁给AI领域的热浪，我今天也来写一篇文章助助兴！ tensorRT-LLM前身为fastertransformer，和tensorRT相结合之后，融合了二者的feature，就叫tensorRT-LLM了（后文简称trtllm），对于fastertransformer，可以认为我的课程三是一个简易版的fastertransformer，对于tensorRT，这是一个半开源的NV GPU sota推理引擎，主要得益于NV 几千个library的极致kernel性能优化，以及high-level的图优化加上low-level的runtime优化。本文主要聚焦于trtllm在编译期和运行时的优化部分，trt构图部分省略。 TensorRT myelin compiler compile的过程发生在trtllm build期间，TensorRT myelin compiler可以遍历模型整图，为每个op选择最佳kernel以及识别潜在的fusion pattern做kernel fusion，这个过程叫做pattern match。此外 TensorRT 还将图编译成一个 CUDA graph，减少kernel launch开销。但是，我要说但是， TensorRT comp ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

掌上春城 · 突然宣布涨价！

6 小时前

云南网 · 黄文被判死缓！湖南常德“冲撞小学生等人群”案一审宣判

昨天

春城晚报 · 知名超市又被曝！网友：太吓人！最新回应......

3 天前

云南网 · 刚刚，云南鲁甸突发地震！

3 天前

昆明发布 · 登上全国旅游热搜榜！来昆明旅居的10个理由，他们这样说……

5 天前

immunity速读 · Nature cell biology: EMT转录因子Zeb1调控癌细胞铁死亡敏感性

5 月前

外滩教育 · 文科爸把儿子培养成"小马斯克"，在家造火箭，百万网友围观…

3 月前

海西房产网 · 【公告】均价11498元/㎡，福州再度抛售21套住宅！

1 月前