文章预览
曹士圯 腾讯研究院 腾讯研究院 AGI 路线图系列专题研究四 本期 AGI 路线图中关键节点:Sora、DiT、Runway Gen-3、可灵 AI、Oasis、世界模拟器 2022 年,Stable Diffusion 和 ChatGPT 先后点燃了 AI 图像生成和大语言模型的燎原火星,两个领域也一同组成了此次生成式 AI 浪潮的最大两块版图。与之相对的是,AI 视频生成虽受关注,却因技术进展缓慢鲜见波澜。直至 2024 年 2 月,OpenAI 以世界模拟器的名号发布了视频生成模型 Sora,可以生成长达一分钟的逼真视频。这个领域自此变天了。 从生成图像到生成视频 视频本质上是连续的图像,视频生成与图像生成也同属于视觉生成任务,因此绝大多数视频生成算法都是从图像生成算法发展而来。 两大路线解百倍难题 相比静态图像生成,视频生成是一项难百倍的任务。视频由图像连续拼接而成,按照影视业常用的帧率范
………………………………