文章预览
北大和港中文联合腾讯人工智能实验室提出了
ViewCrafter,这是一种利用视频扩散模型的先验从单个或稀疏图像合成一般场景的高保真新视图的新方法。 可以简单理解为将复杂的图像转换成新角度的图像版本。首先,它会使用特殊的算法来读取一张或几张图像,创建一个三维的"模型",这就像是把镜头给移动了一样。然后,使用一种叫做视频扩散的技术,从这个模型生成多个角度的图像,确保生成出来的新图像清晰且自然。该方法有望能够在多种应用中有效使用,比如制作游戏画面或者影视特效等。 相关链接 论文地址:http://arxiv.org/abs/2409.02048v1 项目地址:https://drexubery.github.io/ViewCrafter/ 论文阅读 ViewCrafter:驯服视频扩散模型以实现高保真新颖视图合成 摘要 尽管神经 3D 重建最近取得了进展,但对密集多视图捕获的依赖限制了它们的广泛适用性
………………………………