专栏名称: 3D视觉工坊
1、OpenCV的技术传播; 2、3D点云与重建技术; 3、Vslam技术; 4、深度学习; 5、技术干货分享。
目录
相关文章推荐
进出口银行  ·  合作·发展 | ... ·  5 天前  
今天看啥  ›  专栏  ›  3D视觉工坊

ECCV'24 | 真假难辨!自动驾驶场景语义图像合成新方案

3D视觉工坊  · 公众号  ·  · 2024-09-03 07:00

文章预览

点击下方 卡片 ,关注 「3D视觉工坊」 公众号 选择 星标 ,干货第一时间送达 本次分享我们邀请到了清华大学智能产业研究院 & 计算机系 一年级 博士生 高焕昂 为大家详细介绍他的工作。如果您有相关工作需要分享,欢迎文末联系我们。 SCP-Diff: Spatial-Categorical Joint Prior for Diffusion Based Semantic Image Synthesis 论文 : https://arxiv.org/pdf/2403.09638 主页 : https://air-discover.github.io/SCP-Diff/ 语义图像合成任务在自动驾驶传感器模拟中展现出良好的前景。然而,该领域目前最佳做法基于GAN,尚未达到期望的质量水平。随着潜在扩散模型在图像生成领域取得重大进展,我们评估了ControlNet,一种以其密集控制能力而著称的方法。我们的调查发现其结果存在两个主要问题:在大型语义区域内存在奇怪的子结构,以及内容与语义掩码不对齐。通过实证研究,我们发现这些问题的根 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览