文章预览
导读 本文是VCC张锴熠同学对论文 Mahalanobis Distance-based Multi-view Optimal Transport for Multi-view Crowd Localization 的解读,该工作来自深圳大学可视计算研究中心、香港城市大学以及光明实验室联合研究课题组,已被计算机视觉顶级会议ECCV 2024收录,并已申请发明专利。 项目主页: https://vcc.tech/research/2024/MVOT 该工作提出了 一种基于多视角最优传输的多视角人群定位方法,借助马氏距离充分建模了相机视角图像向地平面投影造成的畸变的几何特征。 该方法可在后续诸如人群追踪,自动驾驶等应用中发挥更大作用。 I 引言 多视角人群定位[1,2]被提出用于预测人们在现场地面上的位置,可用于人群分析、自动驾驶、公共交通管理等应用。其通过特征提取和每个相机的投影来融合多相机信息,投影后摄像机视图变成一个公共地平面,然后进行多视图融合和
………………………………