专栏名称: 量子位
վ'ᴗ' ի 追踪AI行业和技术动态,这里更快一步!关注我们,回复“今天”,更多大新闻等你来发现
今天看啥  ›  专栏  ›  量子位

腾讯版Sora发布即开源!130亿参数,模型权重、推理代码全开放

量子位  · 公众号  · AI  · 2024-12-03 14:57
    

主要观点总结

梦晨发布腾讯版Sora视频生成模型,这是目前参数量最大的开源视频生成模型。该模型具备超写实画质、高语义一致性、运动画面流畅和原生镜头转换等特点。文章详细描述了模型在冲浪题材、镜子题材的应用实例,并介绍了模型的技术亮点,包括多模态大语言模型的适配、混合图片/视频训练的支持以及全注意力机制的应用。此外,文章还提到了MEET2025智能未来大会的嘉宾阵容和报名情况。

关键观点总结

关键观点1: 腾讯版Sora视频生成模型成为目前参数量最大的开源视频生成模型。

梦晨发布了这一模型,其权重、推理代码、模型算法等都已上传至GitHub和Hugging Face。该模型具备超写实画质、高语义一致性等特点。

关键观点2: 腾讯混元视频生成模型的四大特点。

该模型能生成超写实画质的内容,具备高语义一致性,运动画面流畅,并具备原生镜头转换能力。

关键观点3: 模型在实际应用中的表现。

文章通过实例展示了模型在冲浪题材和镜子题材的应用,并结合具体案例进行分析。

关键观点4: 模型的技术亮点。

模型的技术亮点包括适配多模态大语言模型、支持混合图片/视频训练以及采用全注意力机制等。

关键观点5: MEET2025智能未来大会的嘉宾阵容和报名情况。

大会嘉宾阵容强大,包括李开复博士、周志华教授等。观众报名通道已开启,欢迎参加。


文章预览

梦晨 西风 发自 凹非寺 量子位 | 公众号 QbitAI 腾讯版Sora,发布即开源! 130亿参数 ,成为目前参数量最大的开源视频生成模型。 模型权重、推理代码、模型算法 等全部上传GitHub与Hugging Face,一点没藏着。 实际效果如何呢? 不瞒你们说,我真的看见一只大熊猫,在跳广场舞、吃火锅、打麻将,请看VCR: 到底是来自四川的猫! 目前该模型已上线腾讯元宝APP,用户可在AI应用中的“AI视频”板块申请试用。 API同步开放测试, 开发者可通过腾讯云接入。 ‍ ‍ ‍ ‍ ‍ ‍ ‍ 腾讯混元视频生成主打四大特点: 超写实画质 ,模型生成的视频内容具备高清质感、真实感,可用于工业级商业场景例如广告宣传、创意视频生成等商业应用。 高语义一致 , 用户可以进行细致的刻画,例如生成主体的细节,人物概念的组合等。模型可以准确的表达出文本的内容。 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览