文章预览
本文介绍了DAT,首个室外无人机主动跟踪基准,用于评估智能体在开放世界主动跟踪任务上的跨场景跨域能力。实验结果表明,现有的视觉主动跟踪模型在复杂场景中的特征提取能力有限,且其感知范围和应用场景受限于固定前向视角。本文深入分析并理论证明了固定前向视角的局限性,并提出了基于强化学习的R-VAT模型。该模型能适应可变视角,实验证明了其高度有效性。 论文标题: A Cross-Scene Benchmark for Open-World Drone Active Tracking 论文链接: https://arxiv.org/pdf/2412.00744 源码链接: https://github.com/SHWplus/DAT_Benchmark 文档链接: https://dat-benchmark.tech 主页链接: https://dat-benchmark.framer.website/ 一、引言 图1:DAT基准的场景示例图 1.1 什么是视觉主动跟踪? 视觉主动 跟 踪 是一种基于视觉观测,控制观测系统运动,从而实现自动跟踪物体的任务设定。相比之下
………………………………