专栏名称: GiantPandaCV
专注于机器学习、深度学习、计算机视觉、图像处理等多个方向技术分享。团队由一群热爱技术且热衷于分享的小伙伴组成。我们坚持原创,每天一到两篇原创技术分享。希望在传播知识、分享知识的同时能够启发你,大家一起共同进步(・ω<)☆
今天看啥  ›  专栏  ›  GiantPandaCV

vLLM源码之模型并行

GiantPandaCV  · 公众号  · 3D  · 2024-09-07 23:54

主要观点总结

本文主要分析了vLLM的模型并行实现,结合代码和图示详细介绍了模型并行的基本原理以及vLLM在模型并行方面的实现方式。文章还探讨了vLLM模型并行与xDiT项目中Tensor Parallel技术之间的关系。

关键观点总结

关键观点1: 文章背景介绍

作者首先介绍了关于vLLM和xDit的背景知识,并引出对模型并行的讨论。

关键观点2: 模型并行基础

介绍了模型并行的基本原理,包括Transformer架构、分布式矩阵乘法等。

关键观点3: vLLM模型并行的实现

详细分析了vLLM的模型并行实现,包括其整体组件结构、模型层实现以及模型并行执行流程。

关键观点4: vLLM与xDit的关联

探讨了vLLM的模型并行与xDit项目中Tensor Parallel技术之间的关系,解释了为何Tensor Parallel在xDit里是灰色的。

关键观点5: 总结

总结了文章的主要内容和观点,回答了文章的核心问题。


文章预览

原文:https://zhuanlan.zhihu.com/p/716124020 关于vLLM,之前介绍过vLLM框架( vLLM源码之框架执行 )和PagedAttention的算子( vLLM源码之PagedAttention ),本文主要结合代码,希望可以图文并茂 的方式分析vLLM的模型并行(vLLM版本为v0.5.1)。 背景 笔者上周前学习了一下xDiT这个优秀的项目  https:// github.com/xdit-project /xDiT  (https://github.com/xdit-project/xDiT),并且对vLLM和xDiT做了一些个人的思考(手抓饼熊:从xDiT和vLLM引起对分布式系统的思考https://zhuanlan.zhihu.com/p/715604870) 。回头看xDiT主页上的图笔者发现了一些神奇的事情。 xDiT整体架构 如上图所示,Tensor Parallel这个技术在xDiT里是灰色的,笔者觉得这个颜色,必有深意,于是便有了今天这篇文章,专门分析vLLM的模型并行实现,有了这个基础,Tensor Parallel这个技术在xDiT里是灰色的原因也就出来了。 本文首先分析一下 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览