Sora这就落伍了？Meta“最强视频模型”不用DiT，用Llama大力出奇迹了

硅星人Pro · 公众号 · 科技媒体 · 2024-10-05 09:59

主要观点总结

Meta发布了新的视频模型“Movie Gen”，声称在技术效果上超过了OpenAI的Sora。Movie Gen包括一系列模型，用于生成媒体内容。其中最大的基础文生视频生成模型是Movie Gen Video，具有300亿参数。此外，还有针对个性化视频生成和精准视频编辑的模型。Movie Gen采用了一种新的技术路线，不再使用扩散模型（DiT）架构，而是结合了Flow Matching和Meta自己的Llama架构。Meta使用大量GPU和服务器资源进行模型训练，并展示了多个创新技巧。Movie Gen旨在用于Meta的社交媒体和下一代计算平台生态。

关键观点总结

关键观点1: Meta发布新的视频模型‘Movie Gen’，宣称打败Sora。

Movie Gen是一个组合模型，包括文生视频生成模型、音频生成模型等。

关键观点2: Movie Gen的技术特点和创新之处

采用新的技术路线，不使用扩散模型（DiT）架构；结合了Flow Matching和Meta自己的Llama架构；使用大量GPU和服务器资源进行模型训练；在模型各环节采用多个创新技巧。

关键观点3: Movie Gen的应用前景

旨在用于Meta的社交媒体和下一代计算平台生态；具有广泛的应用场景，如个性化视频生成、精准视频编辑等。

文章预览

作者｜王兆洋邮箱｜ wangzhaoyang@pingwest.com 在OpenAI Sora的主要技术负责人跑去Google、多个报道指出OpenAI Sora在内部因质量问题而导致难产的节骨眼，Meta毫不客气发了它的视频模型“Movie Gen”，并直接用一个完整的评测体系宣告自己打败了Sora们。而且更狠的是，Meta还“杀人诛心”，虽然这模型目前和Sora一样还没对外开放，但它把新模型的95页技术报告（没有开源，但包含很多细节）公开，并且告诉大家：这模型不仅效果上打败了Sora，而且用了新的技术路线——也就是证明了Sora的技术路线在今天也不再是最先进的了。各位文生视频玩家们，别“抄”Sora了。 1 “媒体基座模型” 准确说，Meta发布的是一系列模型，一个为了实现“AI生成媒体内容”而创建的一个组合。这也是这个技术论文的标题的意思：Movie Gen: A Cast of Media Foundation Models 这个组合包括 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

腾讯研究院 · 腾讯研究院AI速递 20250103

15 小时前

ZEALER · 2030 年的 AI 大厂，五年前只在造车

17 小时前

新浪科技 · 【美国普查局：#世界人口在元旦将达到80.9亿#】据美联社202-20250101131509

2 天前

36氪 · 8点1氪：保时捷取消车主新年礼物及年度试驾；乒协称同意马龙、樊振东和陈梦退出世界排名；特斯拉推出新功能可预防“开门杀”

2 天前

新浪科技 · #已下单小米SU7可限时改璀璨洋红色#【小米汽车：#璀璨洋红色小-20241231215000

2 天前

法国文学bot · 他人之不足我尽有，但仍觉得他人所为不可思议。《生而不称意》E.M-20240805185214

5 月前

小蒜苗长 · @张抗抗KK 抗博排面！ -20240819174636

4 月前

塔罗牌解忧馆 · 解忧塔罗店日历 | 明日预报（2024.09.27）

3 月前

南京有个号 · 南京网红树，排队打卡中……

1 月前