主要观点总结
本文介绍了华中科技大学人工智能研究所在读博士蒋浩懿的工作:Symphonies。Symphonies是一种用于三维语义场景补全的方法,特别适用于自动驾驶领域。该方法通过实例查询引导三维场景建模,结合实例感知编码器和解码器中的实例查询嵌入,实现了对场景上下文信息的理解。研究在SemanticKITTI和SSCBench-KITTI-360基准上取得了最先进性能。
关键观点总结
关键观点1: 研究背景与目的
随着自动驾驶领域的快速发展,三维语义场景补全成为关键研究方向。Symphonies旨在解决现有方法在体素级建模上的不足,通过结合实例语义和场景上下文信息,提高场景理解的准确性。
关键观点2: 方法介绍
Symphonies采用实例感知编码器提取RGB图像的多尺度二维特征,并通过解码器中的实例查询嵌入和可变形注意力机制,实现二维到三维特征的传导和场景上下文的捕捉。
关键观点3: 实验与成果
Symphonies在SemanticKITTI和SSCBench-KITTI-360数据集上取得了显著成果,达到了最先进的性能。相较于现有算法,Symphonies在实例类别如车辆、建筑等方面的表现更突出。
关键观点4: 邀请与分享
本次分享邀请到了华中科技大学人工智能研究所在读博士蒋浩懿,为大家详细介绍其工作:Symphonies。如有相关工作需要分享,欢迎联系相关联系方式。
文章预览
本次分享我们邀请到了华中科技大学人工智能研究所在读博士蒋浩懿,为大家详细介绍他们的工作:Symphonies.如果您有相关工作需要分享,欢迎文末联系我们 Symphonize 3D Semantic Scene Completion with Contextual Instance Queries 论文链接 : https://arxiv.org/pdf/2306.15670 代码链接 : https://github.com/hustvl/Symphonies 直播信息 时间 2024年6月13日(周四)晚上20:00 主题 CVPR'24|Symphonies:基于实例级建模的3D场景占用预测新SOTA! 直播平台 3D视觉工坊哔哩哔哩 扫码观看直播,或前往B站搜索3D视觉工坊观看直播 3DCV视频号 也将同步直播 嘉宾介绍 蒋浩懿 华中科技大学人工智能研究所在读博士,研究方向为视觉感知、3D场景理解、自动驾驶。担任TPAMI, TIP, NeurIPS, CVPR, ICCV, ECCV, ICLR, ICML, ICRA等学术期刊及会议审稿人。 直播大纲 3D 语义场景补全/场景占用预测现有方法简介 Symphonies 论文详解 讨
………………………………