文章预览
关注“ FightingCV ”公众号 回复“ AI ”即可获得超100G人工智能的 教程 点击进入→ FightingCV交流群 来源 :AI视界引擎 仅用于学术分享,若侵权请联系删除 代码:https://github.com/QinSY123/2024-MambaVC 1 Introduction 视觉压缩是多媒体处理中一个长期存在的问题。在过去的几十年里,经典标准[6; 7]长期占据主导地位。随着深度神经网络结构如 CNNs 和 Transformers 的出现,学习型压缩方法已经崭露头角,并显示出不断提高的性能,逐渐超过传统方法,引起了越来越多的兴趣。 视觉压缩的核心是神经网络设计,以消除冗余信息并捕捉内容分布,这自然呈现了在率失真优化与模型效率之间的两难选择。尽管基于CNN的方法在许多资源受限的情境中仍受欢迎,得益于硬件高效的卷积运算符,但它们局部的感受野限制了全局上下文建模能力,从而限制了压缩性能。相比之下
………………………………