文章预览
今日更新21篇: 计算机视觉 17篇 自然语言处理 4篇 如果你想增加某个领域或会议的收集,可以后台私信。 计算机视觉: 17篇 [0] Self-Supervised Contrastive Learning for Videos using Differentiable Local Alignment[cs.CV] 标题:基于可微分局部对齐的视频自监督对比学习 作者:Keyne Oei, Amr Gomaa, Anna Maria Feit, João Belo 链接:http://arxiv.org/abs/2409.04607 摘要 :鲁棒的帧级嵌入对于执行视频分析和理解任务至关重要。我们提出了一种基于对齐时间视频序列的表示学习方法。我们的框架使用基于transformer的编码器来提取帧级特征,并利用这些特征来寻找视频序列之间的最优对齐路径。我们引入了新的局部对齐对比损失(LAC),它结合了可微分局部对齐损失来捕捉局部时间依赖,并通过对比损失来增强区分性学习。以往的视频对齐工作主要集中在使用跨越序列对的全球时间顺序,而我
………………………………