专栏名称: 深度学习工坊
一个专注深度学习方向的公众号,专注分享实战干货,涉及机器学习、CV、NLP、C/C++、Python等方向。
今天看啥  ›  专栏  ›  深度学习工坊

CVPR 2024 涨点!RMem: 用更少的信息,理解更难/更长的视频

深度学习工坊  · 公众号  ·  · 2024-06-22 23:59

文章预览

点这里 👇 关注我,记得标星,么么哒~ 点击进入—> 【Mamba/多模态/扩散】交流群 添加微信:CVer5555,小助手会拉你进群! 扫描下方二维码,加入CVer学术星球 ! 可以获得最新顶会/顶刊上的论文idea 和 CV从入门到精通资料,及最前沿应用 !发论文/搞科研/涨薪,强烈推荐! 作者:庞子奇 https://zhuanlan.zhihu.com/p/703340384 宣传一下这次CVPR 2024的工作——我们试图理解并尝试 对于更长/更难的视频理解,什么样的Temporal Information是有用的 。 具体在Video Object Segmentation的任务上,我们发现 用一个精简而且有限的Memory Bank筛选和存储Temporal Information,要比盲目地存储所有时段的信息更有用 。 我们的【 精简Memory Bank 】被我们称作“ Restricted Memory Banks ”  (RMem) ,它表面上利用了更少的信息,但是实际上却 显著地在视频理解最难的两个场景下取得了显著的提升 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览