专栏名称: 清熙

清晰、客观、理性探讨大模型（LLM）、人工智能（AI）、大数据（Big Data）、物联网（IoT）、云计算（Cloud）、供应链数字化等热点科技的原理、架构、实现与应用。

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

Meta Movie Gen 技术原理

清熙 · 公众号 · · 2024-10-05 19:36

文章预览

年初 OpenAI 放出 Sora 后，文生视频领域发展如火如荼，不断有令人惊喜的进展。当时笔者曾整理过其技术原理 - 解读OpenAI Sora文生视频技术原理，获得了近 30万阅读，以及各种媒体的转载。今天，Meta 放出“影片生成（ MovieGen）”基础模型，再次引发行业热点：可以生成具有不同的宽高比和同步音频的1080p高清视频，同时支持精确的基于指令的视频编辑和基于用户图像的个性化视频生成。其最大的视频生成模型是一个30B参数的Transformer，训练时使用了最大73K上下文长度的视频token，能够以16帧每秒的速度生成16秒视频。并且可以同时生成高保真图像和音频。不同于OpenAI的技术封闭，Meta 公开了详细的技术文档，业界良心，绝对可以成为该领域从业者的宝典： https://ai.meta.com/static-resource/movie-gen-research-paper 。对照年初笔者对Sora技术原理的判断，研读 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博