文章预览
本报告摘自:《 开源证券_行业周报_积极把握AI应用及游戏板块进攻弹性_传媒互联网团队_20241007 》 研报首发时间:2024年10月7日 核心观点 · 视频生成领域大模型竞赛加码,或继续助推多模态AI应用商业化落地 10 月 4 日, Meta 发表论文《 Movie Gen: A Cast of Media Foundation Models 》,首次公开其用于媒体的突破性生成式 AI 模型组合,包括 300 亿参数的最大基础文生视频模型 Movie Gen Vedio 、 130 亿参数的最大基础音频生成模型 Movie Gen Audio ,及对 Movie Gen Video 模型进行后训练获得的 Personalized Movie
Gen Video 和 Movie Gen Edit ,从而可实现文本生成视频及音频、图片生成视频、个性化视频生成、精准编辑视频等功能, Meta 表示 Movie Gen 在这些方面表现均优于业内类似模型,且其通过联合预训练,处理约 1 亿个视频和约 10 亿张图像,通过“观看”视频来学习视觉世界
………………………………