关注图网络、图表示学习,最近顶会顶刊动态以及机器学习基本方法,包括无监督学习、半监督学习、弱监督学习、元学习等
今天看啥  ›  专栏  ›  深度图学习与大模型LLM

文本到视频生成(Text-to-Video Generation, T2V)领域进行了全面的综述

深度图学习与大模型LLM  · 公众号  ·  · 2024-07-19 08:38

文章预览

大家好,今天给大家介绍一篇最新的研究论文《From Sora What We Can See: A Survey of Text-to-Video Generation》。这篇论文对文本到视频生成(Text-to-Video Generation, T2V)领域进行了全面的综述,特别聚焦于OpenAI最新发布的Sora模型所带来的启示。推荐这篇论文,因为它不仅系统性地梳理了T2V领域的最新进展,还深入分析了Sora模型的创新点及其对未来研究方向的指引,对于理解和推动T2V技术的发展具有重要意义。 1. 基本信息 这篇论文的详细信息如下: 题目:From Sora What We Can See: A Survey of Text-to-Video Generation 作者:Rui Sun*, Yumin Zhang*†, Tejal Shah, Jiahao Sun, Shuoying Zhang, Wenqi Li, Haoran Duan, Bo Wei, Rajiv Ranjan 其中Rui Sun和Yumin Zhang为共同第一作者,Yumin Zhang为通讯作者 作者单位: Newcastle University, UK:Rui Sun, Yumin Zhang, Tejal Shah, Wenqi Li, Haoran Duan, Bo Wei, Rajiv Ranjan FLock.io, UK:Jiahao Sun, S ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览