专栏名称: FightingCV
一个专注于分享计算机视觉、多模态机器学习方向前沿论文,解答常见科研问题,分享好用科研工具的公众号。努力努力再努力,瑞思拜!
目录
相关文章推荐
今天看啥  ›  专栏  ›  FightingCV

比CNN和Transformer提高9.3%、15.6%,同时计算量大减!

FightingCV  · 公众号  ·  · 2024-06-08 10:58
    

文章预览

关注“ FightingCV ”公众号 回复“ AI ”即可获得超100G人工智能的 教程 点击进入→   FightingCV交流群 来源 :AI视界引擎 仅用于学术分享,若侵权请联系删除 代码:https://github.com/QinSY123/2024-MambaVC 1 Introduction 视觉压缩是多媒体处理中一个长期存在的问题。在过去的几十年里,经典标准[6; 7]长期占据主导地位。随着深度神经网络结构如 CNNs 和 Transformers 的出现,学习型压缩方法已经崭露头角,并显示出不断提高的性能,逐渐超过传统方法,引起了越来越多的兴趣。 视觉压缩的核心是神经网络设计,以消除冗余信息并捕捉内容分布,这自然呈现了在率失真优化与模型效率之间的两难选择。尽管基于CNN的方法在许多资源受限的情境中仍受欢迎,得益于硬件高效的卷积运算符,但它们局部的感受野限制了全局上下文建模能力,从而限制了压缩性能。相比之下 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览
推荐文章