文章预览
来源:专知 本文 约1500字 ,建议阅读 5 分钟 本论文聚焦于 有限监督下的三维任务 ,即训练数据有限且不完整的场景。 在过去的十年里,深度学习引发了计算机视觉领域的革命,尤其是在二维图像感知与生成方面的巨大进展。这一突破主要归功于大量可用的训练数据,即图像数据。然而,我们所处的真实世界是三维的,理解周围环境的几何结构与视觉外观对于深度学习系统至关重要。这些系统构成了众多应用的基础,包括机器人技术、虚拟/增强现实、视觉生成式人工智能(AIGC)、电子游戏和元宇宙等。然而,3D数据的获取通常成本高昂且充满挑战,导致用于训练深度学习模型的可靠3D真实数据极度稀缺。因此,迫切需要能够在有限观测条件下(如来自RGB相机的单目2D图像或来自深度传感器的不完整3D扫描)高效恢复或风格化3D物体的学习机制。 本
………………………………