文章预览
点击下方 卡片 ,关注 「3D视觉工坊」 公众号 选择 星标 ,干货第一时间送达 本次分享我们邀请到了清华大学智能产业研究院 & 计算机系 一年级 博士生 高焕昂 为大家详细介绍他的工作。如果您有相关工作需要分享,欢迎文末联系我们。 SCP-Diff: Spatial-Categorical Joint Prior for Diffusion Based Semantic Image Synthesis 论文 : https://arxiv.org/pdf/2403.09638 主页 : https://air-discover.github.io/SCP-Diff/ 语义图像合成任务在自动驾驶传感器模拟中展现出良好的前景。然而,该领域目前最佳做法基于GAN,尚未达到期望的质量水平。随着潜在扩散模型在图像生成领域取得重大进展,我们评估了ControlNet,一种以其密集控制能力而著称的方法。我们的调查发现其结果存在两个主要问题:在大型语义区域内存在奇怪的子结构,以及内容与语义掩码不对齐。通过实证研究,我们发现这些问题的根
………………………………