CVPR2025最新《Transformer模型》论文速读

专知 · 公众号 · · 2025-03-18 11:00

文章预览

IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR)是计算机视觉领域的顶级国际会议，CCF A类会议。CVPR2025将于2025年6月11日至15日在美国田纳西州纳什维尔举办。CVPR 2025 共有13,008 份投稿，录用2878篇，录取率为 22.1%。 1. VGGT：基于视觉几何的Transformer模型我们提出了VGGT，这是一种前馈神经网络，能够直接从场景的一个、几个甚至数百个视角中推断出所有关键的3D属性，包括相机参数、点云图、深度图和3D点轨迹。这一方法在3D计算机视觉领域迈出了重要一步，因为传统模型通常局限于单一任务并专门优化。VGGT不仅简单高效，能够在不到一秒的时间内重建图像，而且在性能上超越了需要后处理（如视觉几何优化技术）的替代方案。该网络在多个3D任务中实现了最先进的成果，包括相机参数估计、多视角深度估计、密集点云重建和3D点跟踪。我们还展示 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博