专栏名称: 数据派THU
本订阅号是“THU数据派”的姊妹账号,致力于传播大数据价值、培养数据思维。
今天看啥  ›  专栏  ›  数据派THU

【博士论文】可控图像与视频合成

数据派THU  · 公众号  · 大数据  · 2024-09-20 17:00

文章预览

来源:专知 本文 为论文介绍 ,建议阅读 5 分钟 本论文在图像和视频合成领域提出了几项进展,介绍了灵活的控制方式,增强了用户交互能力,并促进了定制内容的创作。 近年来,生成模型取得了显著进展,大大提升了合成图像和视频的质量。本论文在此基础上进一步研究了生成模型的可控性。在提高合成质量的同时,使生成模型具备控制合成内容的能力也至关重要,因为可控性为用户交互和定制内容创作铺平了道路。本论文研究了可控的图像和视频合成,内容包括基于对话驱动的人脸图像操控、文本引导的人体图像与视频生成,以及从文本和图像生成视频。 本论文首先探讨了人脸的操控。为了使人脸编辑更加可控,提出了一种名为“Talk-to-Edit”的方法,该方法通过用户与机器之间的对话逐轮编辑人脸图像。对话由自然语言组成,但比自然语言 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览