文章预览
《4D Contrastive Superflows are Dense 3D Representation Learners》 github.com/Xiangxu-0103/SuperFlow 这篇论文介绍了一种名为SuperFlow的新框架,旨在通过利用连续的激光雷达-相机对来建立时空预训练目标,以提高自动驾驶中准确的3D感知能力。SuperFlow框架通过整合两个关键设计来解决现有模型对大量人工注释依赖的问题:1) 密集到稀疏的一致性正则化,促进在学习过程中对点云密度变化的不敏感;2) 基于流的对比学习模块,精心设计以从现成的传感器校准中提取有意义的时间线索 。 此外,SuperFlow还加入了一个即插即用的视图一致性模块,以增强从相机视图中提取的知识的对齐。通过在11个不同的激光雷达数据集上的广泛比较和消融研究,验证了其有效性和优越性。通过在预训练期间扩展2D和3D骨干网络的规模,还观察到一些有趣的新出现的特性,为基于激光雷达感知的3
………………………………