专栏名称: 腾讯研究院
【腾讯研究院 ★ Tencent Research Institute】 网聚智慧,连接世界!网罗互联网前沿理念、传递互联网发展声音、汇集互联网研究成果、推动互联网法治进程。
今天看啥  ›  专栏  ›  腾讯研究院

AI视频的后Sora时代

腾讯研究院  · 公众号  · 科技媒体  · 2024-12-02 17:02
    

主要观点总结

本文主要介绍了视频生成模型的发展状况,包括Sora、DiT、Runway Gen-3、可灵 AI等模型的关键进展,以及视频生成模型的评测体系、应用落地、生态培育等方面的情况。同时,文章还探讨了视频生成模型距离世界模拟器还有多远的问题。

关键观点总结

关键观点1: 视频生成模型的进展

Sora、DiT、Runway Gen-3、可灵 AI等模型的出现,标志着视频生成模型的快速发展。这些模型在视频生成质量、生成速度、多模态支持等方面取得了显著进展。

关键观点2: 视频生成模型的评测体系

视频生成模型的评测体系尚不完善,但已经有一些评测指标和公开比赛来评估模型的效果。用户反馈和社区互动也是模型评估的重要依据。

关键观点3: 视频生成模型的应用落地

视频生成模型在创意视频制作、电影预告片生成、广告推广等领域有广泛的应用前景。厂商们也在通过工具应用、社区培育、艺术家合作等方式来培育AI创作生态。

关键观点4: 视频生成模型距离世界模拟器还有多远

虽然视频生成模型已经取得了显著进展,但距离真正的世界模拟器还有很长的路要走。成本过高、模态不全、长视频生成不稳定等问题仍是当前面临的主要挑战。然而,游戏生成模型的进展为世界模拟器的实现带来了新的希望。


文章预览

曹士圯   腾讯研究院 腾讯研究院 AGI 路线图系列专题研究四 本期 AGI 路线图中关键节点:Sora、DiT、Runway Gen-3、可灵 AI、Oasis、世界模拟器 2022 年,Stable Diffusion 和 ChatGPT 先后点燃了 AI 图像生成和大语言模型的燎原火星,两个领域也一同组成了此次生成式 AI 浪潮的最大两块版图。与之相对的是,AI 视频生成虽受关注,却因技术进展缓慢鲜见波澜。直至 2024 年 2 月,OpenAI 以世界模拟器的名号发布了视频生成模型 Sora,可以生成长达一分钟的逼真视频。这个领域自此变天了。 从生成图像到生成视频 视频本质上是连续的图像,视频生成与图像生成也同属于视觉生成任务,因此绝大多数视频生成算法都是从图像生成算法发展而来。 两大路线解百倍难题 相比静态图像生成,视频生成是一项难百倍的任务。视频由图像连续拼接而成,按照影视业常用的帧率范 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览