专栏名称: PaperWeekly

PaperWeekly是一个推荐、解读、讨论和报道人工智能前沿论文成果的学术平台，致力于让国内外优秀科研工作得到更为广泛的传播和认可。社区：http://paperweek.ly | 微博：@PaperWeekly

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

NUS、清华提出STAR：一句话生成高质量4D Avatar，代码已开源

PaperWeekly · 公众号 · 科研 · 2024-06-23 13:46

主要观点总结

本文介绍了新加坡国立大学和清华大学的研究团队提出的'STAR: Skeleton-aware Text-based 4D Avatar Generation with in-network motion Retargeting'算法，该算法能够从文本描述生成高质量的4D Avatar，显著提升了虚拟人物外观和动作的真实性和自然性。文章简要介绍了STAR 算法的核心创新及其在文本到 Avatar 生成领域的贡献。

关键观点总结

关键观点1: 研究背景

基于扩散模型的文本到图像生成（T2I generation）领域近年来取得显著进展，4D角色的创建在电影和游戏行业中引起极大关注。然而，目前主流的基于文本的4D Avatar生成方法存在多面问题、域间隙和动画穿模等挑战。

关键观点2: STAR 算法介绍

为了解决上述挑战，文章提出了STAR算法。其核心在于在优化过程中考虑骨架（Skeleton）、几何（Geometry）以及姿势（Pose）的影响，利用运动重定向（motion retarget）技术获得更准确的骨架控制信号，用于SDS的优化。这一方法显著提升了4D Avatar的生成质量。

关键观点3: STAR 算法的主要流程

给定人物和动作的文本描述，训练4D Avatar的整体算法流程包括利用预训练的文本到动作模型初始化人体动作，通过骨架感知、几何感知和动作感知来更新几何和纹理，同步调整源动作以匹配个性化Avatar的骨架和几何特征。此外，还引入了运动重定向和混合SDS方法来提高生成质量和一致性。

关键观点4: 实验结果

实验结果表明，STAR能够生成具有多样体型特征的角色，并通过3D mesh表示在不同视角下展现更真实的动画效果。定量评估也验证了STAR相较于先前的方法能够生成更加真实的结果。

关键观点5: 结论

本文提出了STAR算法，能够从文本描述中生成高质量4D Avatar。通过逐步优化几何、纹理和动作，特别是在解决源模板与目标Avatar之间的骨架和几何差异方面，展示了在提升虚拟人物生成技术方面的潜力和优越性。

文章预览

©PaperWeekly 原创 · 作者 | Chai Zenghao 单位 | 新加坡国立大学博士生研究方向 | 3D生成背景在计算机图形学和数字虚拟人领域，从简单的文本提示生成更真实、可交互的虚拟人物是是目前广受关注的研究课题。然而，先前的 3D Avatar 生成方法存在一些问题，如生成的人物在动作和细节上往往不够真实。新加坡国立大学和清华大学的研究团队提出了“STAR: Skeleton-aware Text-based 4D Avatar Generation with in-network motion Retargeting”。该算法通过引入角色相关的骨骼感知技术，能够从文本描述生成高质量的 4D Avatar，显著提升了虚拟人物外观和动作的真实性和自然性。本文将简要介绍 STAR 算法的核心创新及其在文本到 Avatar 生成领域的贡献。论文链接： https://arxiv.org/abs/2406.04629 项目主页： https://star-avatar.github.io/ 代码链接： https://github.com/czh-98/STAR 本文动机近年 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博