专栏名称: 深度学习自然语言处理

一个从大三就接触NLP的小小NLPer，本公众号每天记录自己的一点一滴，每篇文章最后也有托福单词等新知识，学技术同时，也一点一滴积累额外的知识。期待与你在知识的殿堂与你相遇！

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

NICE分享 | 如何加速大语言模型推理？万字长文综述大语言模型高效推理技术

深度学习自然语言处理 · 公众号 · · 2024-07-06 22:34

文章预览

主题如何加速大语言模型推理？万字长文综述大语言模型高效推理技术论文：A Survey on Efficient Inference for Large Language Models 地址：https://arxiv.org/pdf/2404.14294 解读： 3万字详细解析清华大学最新综述工作：大模型高效推理综述嘉宾周紫轩，硕士就读于清华大学深圳国际研究生院，目前博0（硕士刚毕业），硕士导师为汪玉教授和董宇涵副教授，博士导师为汪玉教授和张晓平教授，本人研究兴趣主要为模型压缩、大模型高效推理等领域。内容研究背景与基础概念介绍分层、分领域综述高效推理领域的技术 2.1: 数据层 2.2: 模型层 2.3: 系统层（简略）未来方向讨论与结论 QA 研究背景大语言模型（Large Language Models, LLMs）在近些年受到了学术界和工业界的广泛关注，得益于其在各种语言任务上的突出表现，大语言模型推动了各种人工智能应用（如ChatGPT、Co ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博