主要观点总结
文章概述了自动驾驶领域中基于视觉的3D占用网络(Occupancy Network)的研究现状。文中介绍了不同的论文、算法和数据集,涵盖了近期的研究进展和关键点。包括不同的算法框架、数据集和参考资料。
关键观点总结
关键观点1: 论文和算法综述
介绍了多篇关于Occupancy Network的论文和相应的算法,包括A Survey on Occupancy Perception for Autonomous Driving、MonoScene、TPVFormer、SurroundOcc、OccFormer等。这些算法旨在通过感知环境进行简单的在线3D重建,更全面地实现3D场景感知。
关键观点2: 数据集介绍
介绍了多个用于Occupancy Network研究的数据集,包括SemanticKITTI、Occ3D、OpenOccupancy、OpenOcc等。这些数据集基于不同的自动驾驶数据集构建,为Occupancy Network的研究提供了丰富的数据资源。
关键观点3: 参考资料
提供了多个参考资料,包括博客、GitHub项目、知乎问题等。这些资料为读者提供了进一步了解Occupancy Network研究的途径,包括相关论文、算法细节、数据集介绍等。
文章预览
0. 前言 在自动驾驶感知任务中,传统的 3D 场景理解方法大多数都集中在 3D 目标检测上,难以描述任意形状和无限类别的真实世界物体。 3D 占用网络( Occupancy Network )是特斯拉在 2022年 提出的一种新型感知网络,这种感知网络借鉴了机器人领域中的占用网格建图的思想,将感知环境以一种简单的形式进行在线 3D 重建。简单来说,就是将机器人周围的空间划分为一系列网格单元,然后定义哪个单元被占用,哪个单元是空闲的,通过预测 3D 空间中的占用概率来获得一种简单的 3D 空间表示,这样就可以更全面地实现 3D 场景感知。 近期对最近几年自动驾驶领域中的 3D 占用网络算法(主要是基于纯视觉)和数据集做了一些调研,本文将做一个简单的汇总。 1. 论文和算法 综述论文 《A Survey on Occupancy Perception for Autonomous Driving: The Information Fusion Perspective》
………………………………