专栏名称: GiantPandaCV

专注于机器学习、深度学习、计算机视觉、图像处理等多个方向技术分享。团队由一群热爱技术且热衷于分享的小伙伴组成。我们坚持原创，每天一到两篇原创技术分享。希望在传播知识、分享知识的同时能够启发你，大家一起共同进步(･ω<)☆

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

[LLM推理优化] 100+篇: 大模型推理各方向新发展整理

GiantPandaCV · 公众号 · 3D · 2024-05-30 20:10

文章预览

作者丨DefTruth 来源丨https://zhuanlan.zhihu.com/p/693680304 编辑丨GiantPandaCV 0x01 前言从事大模型推理的工作有段时间了，业余有空的时候也会关注一下LLM近期发展的方向，以及一些新的paper。说实话，这些论文没法一一看完，大部分都只是看了摘要和结论，了解一下相关的技术对自己当前所做的业务是否有助益。整理和归纳是自己长期以来的习惯，对于LLM推理的发展也是如此，虽然无法一一深入到所有细节，但至少让自己保持一下对业界发展的敏感度应该还是可以的。 0x02 目录半年多时间，大概收录了100多篇LLM推理相关的论文（paper with codes），既包括了常用的Attention优化、权重量化、KV Cache优化等技术，也涵盖了一些新方向，比如Early Exit、Long Context/Prompt KV Cache优化、Parallel Decoding/Sampling等。 0x03 内容整理的内容都放在了GitHub: https://github.com/DefTruth/Awesome-LL ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博