文章预览
「自动驾驶新青年讲座」由智猩猩企划,致力于邀请全球知名高校、顶尖研究机构以及优秀企业的新青年,主讲在环境感知、精准定位、决策规划、控制执行等自动驾驶关键技术上的最新研究成果和开发实践。 在自动驾驶领域里,针对3D场景的正确理解是非常重要的。目前对于室内场景采用3D密集字幕生成取得了很好的进展,在室外场景中却存在很大的局限性,不仅因为室内、外场景之间存在域差距,还因为当前缺乏针对室外场景的具有全面框-字幕对标注的数据。 基于当前问题,理想汽车联合中科院自动化所等研究人员提出一种室外3D密集描述任务TOD3Cap。该任务输入为LiDAR点云和全景相机组拍摄的一组RGB图像,期望输出为一组带字幕的物体框。与TOD3Cap相关的论文收录于 ECCV 2024 上. 为了解决这一任务,该团队提出了TOD3Cap网络,利用BEV表示生成物
………………………………