专栏名称: 爱可可-爱生活
知名互联网资讯博主 北邮PRIS模式识别实验室陈老师
今天看啥  ›  专栏  ›  爱可可-爱生活

本文提出了一种名为 Q-Filters 的免训练 KV 缓存压缩-20250309061524

爱可可-爱生活  · 微博  · AI  · 2025-03-09 06:15
    

文章预览

2025-03-09 06:15 本条微博链接 本文提出了一种名为 Q-Filters 的免训练 KV 缓存压缩方法,该方法反直觉地利用 Query-Key 向量空间的几何特性,通过简单的上下文无关投影实现了高效的 KV 缓存压缩,显著提升了长上下文语言模型的推理效率,并在多种任务和模型上验证了其优越性,为解决长上下文语言模型的内存瓶颈问题提供了一个高效且易于部署的新方案。 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览