腾讯版Sora发布即开源！130亿参数，模型权重、推理代码全开放

量子位 · 公众号 · AI · 2024-12-03 14:57

主要观点总结

梦晨发布腾讯版Sora视频生成模型，这是目前参数量最大的开源视频生成模型。该模型具备超写实画质、高语义一致性、运动画面流畅和原生镜头转换等特点。文章详细描述了模型在冲浪题材、镜子题材的应用实例，并介绍了模型的技术亮点，包括多模态大语言模型的适配、混合图片/视频训练的支持以及全注意力机制的应用。此外，文章还提到了MEET2025智能未来大会的嘉宾阵容和报名情况。

关键观点总结

关键观点1: 腾讯版Sora视频生成模型成为目前参数量最大的开源视频生成模型。

梦晨发布了这一模型，其权重、推理代码、模型算法等都已上传至GitHub和Hugging Face。该模型具备超写实画质、高语义一致性等特点。

关键观点2: 腾讯混元视频生成模型的四大特点。

该模型能生成超写实画质的内容，具备高语义一致性，运动画面流畅，并具备原生镜头转换能力。

关键观点3: 模型在实际应用中的表现。

文章通过实例展示了模型在冲浪题材和镜子题材的应用，并结合具体案例进行分析。

关键观点4: 模型的技术亮点。

模型的技术亮点包括适配多模态大语言模型、支持混合图片/视频训练以及采用全注意力机制等。

关键观点5: MEET2025智能未来大会的嘉宾阵容和报名情况。

大会嘉宾阵容强大，包括李开复博士、周志华教授等。观众报名通道已开启，欢迎参加。

文章预览

梦晨西风发自凹非寺量子位 | 公众号 QbitAI 腾讯版Sora，发布即开源！ 130亿参数，成为目前参数量最大的开源视频生成模型。模型权重、推理代码、模型算法等全部上传GitHub与Hugging Face，一点没藏着。实际效果如何呢？不瞒你们说，我真的看见一只大熊猫，在跳广场舞、吃火锅、打麻将，请看VCR：到底是来自四川的猫！目前该模型已上线腾讯元宝APP，用户可在AI应用中的“AI视频”板块申请试用。 API同步开放测试，开发者可通过腾讯云接入。 ‍ ‍ ‍ ‍ ‍ ‍ ‍ 腾讯混元视频生成主打四大特点：超写实画质，模型生成的视频内容具备高清质感、真实感，可用于工业级商业场景例如广告宣传、创意视频生成等商业应用。高语义一致，用户可以进行细致的刻画，例如生成主体的细节，人物概念的组合等。模型可以准确的表达出文本的内容。 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博