讨论计算机视觉、深度学习和自动驾驶的技术发展和挑战
今天看啥  ›  专栏  ›  大语言模型和具身智体及自动驾驶

DUSt3R:轻松实现几何 3D 视觉

大语言模型和具身智体及自动驾驶  · 公众号  ·  · 2024-08-28 00:04
    

文章预览

23年CVPR来自芬兰一所大学 和欧洲Naver Labs 的论文“DUSt3R: Geometric 3D Vision Made Easy”。 在实际应用中,多视角立体视觉重建 (MVS) 需要首先估算相机参数,例如内参数和外参数。这些参数通常很繁琐且难以获取,但它们对于在 3D 空间三角化,相应像素是必不可少的,而三角化是所有性能最佳的 MVS 算法核心。这项工作采取了相反的立场,引入 DUSt3R,这是一个用于任意图像集合的密集和无约束立体 3D 重建的全新范例,即无需事先了解相机标定或视点姿势即可进行操作。将成对重建问题视为点图的回归,从而放宽了通常投影相机模型的硬约束。这种公式可以顺利地统一单目和双目重建情况。在提供两张以上图像的情况下,进一步提出一种简单但有效的全局对齐策略,该策略在公共参考系中表达所有成对点图。该网络架构基于标准 Transformer 编码器和解码器 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览