DIVE：利用DINO特征实现精准运动对齐的主体驱动视频编辑框架

ADFeed · 公众号 · · 2025-01-03 11:15

文章预览

DIVE: Taming DINO for Subject-Driven Video Editing 介绍： https://dino-video-editing.github.io/ 论文： https://arxiv.org/abs/2412.03347v1 DINO-guided Video Editing ( DIVE ) 是一个创新的视频生成框架，旨在解决视频编辑中的两个核心挑战：保持时间一致性和运动对齐。 DIVE 框架通过利用预训练的DINOv2模型提取的语义特征作为隐式对应关系，引导编辑过程，从而实现基于目标文本提示或参考图像的源视频中的主体驱动编辑。这一方法不仅能够准确捕捉源视频主体的运动轨迹，还能在编辑过程中保持精确的运动对齐和主体身份的一致性。 DIVE框架的特点在于其三个阶段的处理流程：时间运动建模、主体身份注册和推理。这一流程使得DIVE在实验中展现出了高质量的编辑结果和强大的运动一致性。技术解读 DIVE 技术的总体思路是利用预训练的DINOv2模型的语义特征作为隐式对应关系，来引导 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博