专栏名称: 极市平台
极市平台是由深圳极视角推出的专业的视觉算法开发与分发平台,为视觉开发者提供多领域实景训练数据库等开发工具和规模化销售渠道。本公众号将会分享视觉相关的技术资讯,行业动态,在线分享信息,线下活动等。 网站: http://cvmart.net/
今天看啥  ›  专栏  ›  极市平台

ECCV'24|OMG:已开源,遮挡友好的个性化多概念生成新框架

极市平台  · 公众号  · 科技媒体  · 2024-08-26 22:00

主要观点总结

本文提出了一种两阶段的个性化生成框架OMG,旨在解决多概念个性化生成过程中的遮挡问题。OMG采用概念噪声混合方法,无需任何训练即可与各种单概念个性化生成方法相结合,解决身份退化问题。实验结果表明,OMG在多概念个性化生成方面展现出卓越性能。

关键观点总结

关键观点1: OMG框架的目标

解决多概念个性化生成中的遮挡问题,保持身份特征,确保前景与背景的光照一致性。

关键观点2: OMG框架的特点

采用两阶段采样方法,第一阶段处理遮挡问题并收集视觉理解信息,第二阶段利用收集到的信息整合多个概念,通过概念噪声混合方法实现个性化生成。

关键观点3: OMG框架的方法

使用文本到图像生成模型T2I,通过视觉理解技术确定概念掩码位置,利用噪声概念混合方法将特定概念ID注入图像的特点区域,通过保存和重用注意力图来保持遮挡布局。

关键观点4: 实验与结论

实验证明OMG能够解决遮挡问题,生成高质量图像,且无需额外训练即可与各种单概念定制模型无缝结合,具有通用性和实用性。


文章预览

↑ 点击 蓝字  关注极市平台 作者丨孔哲 中山大学 编辑丨极市平台 极市导读   本文提出了一种两阶段的个性化生成框架OMG,旨在解决多概念个性化生成过程中遇到的遮挡问题。此外,本文还提出了一种概念噪声混合方法,通过这种方法,OMG无需经过任何训练就能轻松地与各种单概念个性化生成方法相结合从而解决身份退化问题。大量实验结果证明,OMG在多概念个性化方面展现出了卓越的性能。   >> 加入极市CV技术交流群,走在计算机视觉的最前沿 论文: https://arxiv.org/abs/2403.10983 代码: https://github.com/kongzhecn/OMG Demo: https://huggingface.co/spaces/Fucius/OMG 项目: https://kongzhecn.github.io/omg-project/ 引用: @inproceedings{kong2024omg,   title={Omg: Occlusion-friendly personalized multi-concept generation  in  diffusion models},   author={Kong, Zhe and Zhang, Yong and Yang, Tianyu and Wang ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览