文章预览
大连理工大学的IIAU团队提出CharacterFactory,不需要参考图片,仅需2.5GB显存训练10分钟,可以在3秒内无限制地端到端地采样出新的一致性角色,可以结合动作、背景、风格等文本提示实现一致性图像生成,并且无需微调即可插入视频/3D生成。 相关链接 Demo: https://huggingface.co/spaces/DecoderWQH666/CharacterFactory Github: https://github.com/qinghew/CharacterFactory(代码已经开源) Project Page: https://qinghew.github.io/CharacterFactory/ Paper: https://arxiv.org/abs/2404.15677 论文阅读 CharacterFactory:扩散模型中gan的采样一致性特征 摘要 文本到图像模型的最新发展为以人为中心的一代开辟了新的领域。然而,这些模型不能直接用于生成具有一致的新生成身份的图像。在本工作中,我们提出了一个字符框架,该框架允许在GANS的潜在空间中对具有一致身份的新字符进行采样,以用于扩散模型。 更具体
………………………………