文章预览
随着扩散模型的发展,定制化生成任务受到广泛关注。 StableIdentity 旨在为文本到图像模型注入新的主题(如身份),并在对齐输入文本提示的同时,生成在不同语境下主题一致的图像。例如,用户可以上传自己的照片以获得有趣的图片,如 "穿着超人服装"。定制生成的成功可以促进许多应用,如个性化肖像照片虚拟试穿和艺术设计。 该方法可以直接与ControlNet等基于Stable Diffusion的即插即用的模块配合使用,甚至可以将学习到的身份插入现成的视频/3D生成的模型中,而无需进行微调即可产生出色的效果。 StableIdentity: Inserting Anybody into Anywhere at First Sight Qinghe Wang 1 , Xu Jia* 1 , Xiaomin Li 1 , Taiqing Li 1 , Liqian Ma 2 , Yunzhi Zhuge 1 , Huchuan Lu 1 1 Dalian University of Technology, 2 ZMO AI Inc. * Corresponding Author 给定单个输入图像,所提出的Stable
………………………………