文章预览
点击下方卡片,关注 「集智书童」 公众号 点击加入👉 「集智书童」 交流群 许多多目标跟踪(MOT)方法利用运动信息来关联跨帧检测到的所有目标。然而,许多基于滤波算法的方法,如卡尔曼滤波器,在线性运动场景中通常工作得很好,但在预测经历复杂和非线性运动的物体的位置时往往表现不佳。 为了解决这些场景,作者提出了一种基于运动的多目标跟踪方法,该方法具有增强的时间运动预测器ETTrack。具体来说,运动预测器整合了 Transformer 模型和时序卷积网络(TCN)来捕捉短期和长期的运动模式,并根据历史运动信息预测个别物体的未来运动。 此外,作者提出了一种新颖的动量校正损失函数,该函数在训练期间提供了关于物体运动方向的信息。这使得运动预测器能够快速适应运动变化,并更准确地预测未来运动。 作者的实验结果表明,ETTr
………………………………