专栏名称: 集智书童
书童带你领略视觉前沿之美,精选科研前沿、工业实用的知识供你我进步与学习!
今天看啥  ›  专栏  ›  集智书童

Sora 与文本到视频生成,探索通用人工智能的里程碑与挑战!

集智书童  · 公众号  ·  · 2024-06-01 09:32
    

文章预览

在取得令人印象深刻的成就后,人工智能正朝着通用人工智能的方向迈进。由OpenAI开发的Sora,其具备分钟 Level 的世界模拟能力,可以被视为这一发展路径上的一个里程碑。然而,尽管Sora取得了显著的成功,它仍然遇到了各种需要解决的障碍。 在本次调查中,作者从解构Sora在文本到视频生成方面的角度出发,进行了全面的文献回顾,试图回答这个问题:“从Sora作者能看到什么”。 具体来说,在介绍了关于通用算法的基本预备知识之后,文献从三个相互垂直的维度进行分类:进化生成器、卓越追求和现实全景。随后,详细整理了广泛使用的数据集和评价指标。 最后但同样重要的是,作者识别了该领域内的几个挑战和开放性问题,并提出了潜在的研究和开发未来方向。 本调查中全面的文本到视频生成研究列表可在https://github.com/soraw-ai/Awesome-Text-to-Vi ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览