专栏名称: 计算机视觉工坊
专注于计算机视觉、VSLAM、目标检测、语义分割、自动驾驶、深度学习、AI芯片、产品落地等技术干货及前沿paper分享。这是一个由多个大厂算法研究人员和知名高校博士创立的平台,我们坚持工坊精神,做最有价值的事~
今天看啥  ›  专栏  ›  计算机视觉工坊

训练难度降低!首次使用2D标签训练多视图3D Occupancy模型!

计算机视觉工坊  · 公众号  ·  · 2023-12-18 20:56

文章预览

来源:计算机视觉工坊 添加微信:dddvision,备注: NeRF ,拉你入群。文末附行业细分群 0. 笔者个人体会 3D占用预测将3D场景量化为带有语义标签的网格单元,但是3D标签的注释非常繁琐,而且很多标签类别并不明确,所以很难去训练3D Occupancy的大模型。 今天笔者为大家分享一项工作RenderOcc,仅使用2D标签就可以训练3D占用模型,算是提供了一种新范式! 下面一起来阅读一下这项工作,文末附论文和代码链接~ 1. 这篇文章希望解决什么问题? 以前方法使用昂贵的3D占用标签进行监督,而RenderOcc使用2D标签来训练3D占用网络,实际使用的是细粒度的2D像素级语义和深度监督。 这里也推荐工坊推出的新课程 《 面向自动驾驶领域的3D点云目标检测全栈学习路线!(单模态+多模态/数据+代码)》 。 2. 具体原理是什么? RenderOcc从多视图图像中提取NeRF风格的3D体素 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览