比CNN和Transformer提高9.3%、15.6%，同时计算量大减！

FightingCV · 公众号 · · 2024-06-08 10:58

文章预览

关注“ FightingCV ”公众号回复“ AI ”即可获得超100G人工智能的教程点击进入→ FightingCV交流群来源：AI视界引擎仅用于学术分享，若侵权请联系删除代码：https://github.com/QinSY123/2024-MambaVC 1 Introduction 视觉压缩是多媒体处理中一个长期存在的问题。在过去的几十年里，经典标准[6; 7]长期占据主导地位。随着深度神经网络结构如 CNNs 和 Transformers 的出现，学习型压缩方法已经崭露头角，并显示出不断提高的性能，逐渐超过传统方法，引起了越来越多的兴趣。视觉压缩的核心是神经网络设计，以消除冗余信息并捕捉内容分布，这自然呈现了在率失真优化与模型效率之间的两难选择。尽管基于CNN的方法在许多资源受限的情境中仍受欢迎，得益于硬件高效的卷积运算符，但它们局部的感受野限制了全局上下文建模能力，从而限制了压缩性能。相比之下 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博