专栏名称: 我爱计算机视觉
关注计算机视觉与机器学习技术的最前沿,“有价值有深度”,分享开源技术与最新论文解读,传播CVML技术的业内最佳实践。www.52cv.net 微博:计算机视觉与机器学习,QQ群:928997753,52CV君个人账号:Your-Word。
今天看啥  ›  专栏  ›  我爱计算机视觉

ECCV 2024 Oral | 西南交大&利兹大学等联合提出金字塔离散扩散模型(PDD),实现了3D户外场景生成的粗到细的策略

我爱计算机视觉  · 公众号  ·  · 2024-09-23 12:14
    

文章预览

关注公众号,发现CV技术之美 本文是对 ECCV 2024 Oral 文章 Pyramid Diffusion for Fine 3D Large Scene Generation 的介绍。代码已经开源。 代码链接:https://github.com/yuhengliu02/pyramid-discrete-diffusion 论文链接:https://arxiv.org/abs/2311.12085 项目官网:https://yuheng.ink/project-page/pyramid-discrete-diffusion/ 使用提出的Pyramid Discrete Diffusion方法生成的无限场景的Demo视频。 Introduction 3D场景生成旨在模拟我们现实世界环境的三维复杂性,从而能够帮助我们更好地理解物理世界。这项技术在自动驾驶,虚拟现实,具身智能中都发挥着至关重要的作用。然而,由于3D场景本身的庞大规模以及缺乏大规模的3D场景数据集,想要生成高质量的3D场景仍然极具挑战性。 尽管生成式扩散模型在生成2D图像或者小型3D物体上也有不错的效果,但是将扩散模型直接应用于3D场景的生成并非易事,特别是3D的户外 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览