专栏名称: 腾讯研究院

【腾讯研究院 ★ Tencent Research Institute】网聚智慧，连接世界！网罗互联网前沿理念、传递互联网发展声音、汇集互联网研究成果、推动互联网法治进程。

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

AI视频的后Sora时代

腾讯研究院 · 公众号 · 科技媒体 · 2024-12-02 17:02

主要观点总结

本文主要介绍了视频生成模型的发展状况，包括Sora、DiT、Runway Gen-3、可灵 AI等模型的关键进展，以及视频生成模型的评测体系、应用落地、生态培育等方面的情况。同时，文章还探讨了视频生成模型距离世界模拟器还有多远的问题。

关键观点总结

关键观点1: 视频生成模型的进展

Sora、DiT、Runway Gen-3、可灵 AI等模型的出现，标志着视频生成模型的快速发展。这些模型在视频生成质量、生成速度、多模态支持等方面取得了显著进展。

关键观点2: 视频生成模型的评测体系

视频生成模型的评测体系尚不完善，但已经有一些评测指标和公开比赛来评估模型的效果。用户反馈和社区互动也是模型评估的重要依据。

关键观点3: 视频生成模型的应用落地

视频生成模型在创意视频制作、电影预告片生成、广告推广等领域有广泛的应用前景。厂商们也在通过工具应用、社区培育、艺术家合作等方式来培育AI创作生态。

关键观点4: 视频生成模型距离世界模拟器还有多远

虽然视频生成模型已经取得了显著进展，但距离真正的世界模拟器还有很长的路要走。成本过高、模态不全、长视频生成不稳定等问题仍是当前面临的主要挑战。然而，游戏生成模型的进展为世界模拟器的实现带来了新的希望。

文章预览

曹士圯腾讯研究院腾讯研究院 AGI 路线图系列专题研究四本期 AGI 路线图中关键节点：Sora、DiT、Runway Gen-3、可灵 AI、Oasis、世界模拟器 2022 年，Stable Diffusion 和 ChatGPT 先后点燃了 AI 图像生成和大语言模型的燎原火星，两个领域也一同组成了此次生成式 AI 浪潮的最大两块版图。与之相对的是，AI 视频生成虽受关注，却因技术进展缓慢鲜见波澜。直至 2024 年 2 月，OpenAI 以世界模拟器的名号发布了视频生成模型 Sora，可以生成长达一分钟的逼真视频。这个领域自此变天了。从生成图像到生成视频视频本质上是连续的图像，视频生成与图像生成也同属于视觉生成任务，因此绝大多数视频生成算法都是从图像生成算法发展而来。两大路线解百倍难题相比静态图像生成，视频生成是一项难百倍的任务。视频由图像连续拼接而成，按照影视业常用的帧率范 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博