专栏名称: 深度学习自然语言处理

一个从大三就接触NLP的小小NLPer，本公众号每天记录自己的一点一滴，每篇文章最后也有托福单词等新知识，学技术同时，也一点一滴积累额外的知识。期待与你在知识的殿堂与你相遇！

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

大模型推理张量并行的4种模式

深度学习自然语言处理 · 公众号 · · 2024-12-22 17:16

文章预览

知乎：手抓饼熊地址：https://zhuanlan.zhihu.com/p/12302566679 编辑：「深度学习自然语言处理公众号」，转载授权请联系作者大模型推理并行方向只有2个难点（特指并行而非分布式，个人觉得分离式架构、分布式调度等均属于大模型推理分布式领域），一个是序列并行、一个是张量并行的通信计算重叠优化。序列并行笔者介绍的比较多了（手抓饼熊：大模型推理序列并行），本文介绍一下张量并行通信计算重叠的一些优化方案。 LLM所有细分方向群+ ACL25/ICML25/NAACL25 投稿群-> LLM所有细分领域群、投稿群从这里进入！背景张量并行目前已经是大模型推理的一个必备的技术，笔者之前分析过vLLM的张量并行（手抓饼熊：vLLM源码之模型并行）。然而张量并行一个缺点是通信开销，当推理采用PCIE类卡的时候，该缺点更加明显。针对通信开销的缺点，训练框 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

BioArt · Protein & Cell学者讲坛系列直播第12期即将开播！

21 小时前

广晟控股集团 · 【广晟要闻】风华高科风华研究院（广州分院）、国星光电先进封装研究中心和佛山照明新质生产力研究中心正式揭牌

昨天

广晟控股集团 · 【广晟要闻】风华高科风华研究院（广州分院）、国星光电先进封装研究中心和佛山照明新质生产力研究中心正式揭牌

昨天

axb的自我修养 · 去海淀大悦城转了一圈，人多到因为排队打起来了，无法理解从哪跑出来-20241221233249

3 天前

李楠或kkk · honda E + iPhone = #蔚来萤火虫# -20241221224134

3 天前

生物制品圈 · 直播推荐 | 浅谈双特异性抗体类型及纯化策略

4 天前

财宝宝 · 如果我当年经济条件好，我会成为什么人？我可能会-20240618205136

6 月前

都市时报 · 禄劝，好甜！

5 月前

爱可可-爱生活 · 【sqlite-rembed：SQLite扩展，用于从远程API-20240811212943

4 月前