文章预览
今天给大家介绍一种文本生成人体姿态的方法PoseDiffusion,该方法旨在通过自然语言生成多样且结构稳定的2D人类姿势骨架。以GUNet为核心模型,该框架结合了图卷积网络和去噪扩散模型,首次实现了基于扩散模型的生成框架。 PoseDiffusion在生成姿势骨架时,能够有效学习人体骨架的空间关系,确保生成的姿势既多样又美观。与现有的生成对抗网络(GAN)方法相比,PoseDiffusion在稳定性和多样性方面表现出显著的优势,能够生成结构正确且符合文本描述的姿势骨架,克服了以往方法中关键点位置不准确和骨骼比例失调的问题。 相关链接 论文链接:http://arxiv.org/abs/2409.11689v1 代码链接:https://github.com/LIANGSHUOWEN/PoseDiffusion 论文阅读 GUNet:一种用于稳定和多样性姿态生成的图卷积网络联合扩散模型 摘要 姿势骨架图像是姿势可控图像生成中的重要参考。
………………………………