一个从大三就接触NLP的小小NLPer,本公众号每天记录自己的一点一滴,每篇文章最后也有托福单词等新知识,学技术同时,也一点一滴积累额外的知识。期待与你在知识的殿堂与你相遇!
今天看啥  ›  专栏  ›  深度学习自然语言处理

大模型推理张量并行的4种模式

深度学习自然语言处理  · 公众号  ·  · 2024-12-22 17:16
    

文章预览

知乎 :手抓饼熊 地址 :https://zhuanlan.zhihu.com/p/12302566679 编辑 :「深度学习自然语言处理 公众号」,转载授权请联系作者 大模型推理并行方向只有2个难点(特指并行而非分布式,个人觉得分离式架构、分布式调度等均属于大模型推理分布式领域),一个是 序列并行、一个是张量并行的通信计算重叠优化 。序列并行笔者介绍的比较多了(手抓饼熊:大模型推理序列并行),本文介绍一下张量并行通信计算重叠的一些优化方案。 LLM所有 细分方向 群+ ACL25/ICML25/NAACL25 投稿群-> LLM所有细分领域群、投稿群从这里进入! 背景 张量并行目前已经是大模型推理的一个必备的技术,笔者之前分析过vLLM的张量并行(手抓饼熊:vLLM源码之模型并行)。然而张量并行一个缺点是通信开销,当推理采用PCIE类卡的时候,该缺点更加明显。 针对通信开销的缺点,训练框 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览