专栏名称: CV技术指南

长期更新：深度学习、计算机视觉相关技术的总结；图像处理相关知识；最新论文；经典论文；论文综述、tensorflow和pytorch等内容总结。涉及领域：神经网络模型、transformer模型、目标检测、语义分割、目标跟踪、视频理解等。

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

NeurIPS 2024 | 南大&腾讯提出VFIMamba：刷新视频插帧SOTA性能

CV技术指南 · 公众号 · · 2024-10-14 12:10

文章预览

前言本文为了实现高效的全局动态时空建模， VFIMamba 结合视频插帧任务的特点，将状态空间模型（ SSMs ）第一次应用于视频插帧任务中。为了适应状态空间模型需要对输入序列化的特征，提出将首尾帧的 token 交错排列的方式来让 SSMs 更好的建模两帧的时空信息。同时，为了更好地挖掘出 SSMs 模型在视频插帧任务的潜力，提出基于课程学习思想的训练策略，通过逐渐增大训练集中的帧间运动幅度来增强 SSMs 对不同运动幅度下时空建模能力。 Pytorch训练营，花两个星期彻底掌握代码实现 CV各大方向专栏与各个部署框架最全教程整理 CV全栈指导班、基础入门班、论文指导班全面上线!! 来源： CVer 仅用于学术分享，若侵权请联系删除论文：https://arxiv.org/abs/2407.02315 代码：github.com/MCG-NJU/VFIMamba 1. 引言在视频插帧（VFI）中，帧间的时空建模至关重要，因 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博