文章预览
转自 | 新智元 编辑 | 桃子 Aeneas 【导读】 Meta版Sora,就在刚刚惊艳来袭。Movie Gen可生成1080p、16秒、每秒16帧的高清长视频,还能生成音效、编辑视频、上传图像生成个性化视频。甚至Meta还放出了92页论文,模型架构、训练细节一并公开,干货满满! 毫无预兆地,Meta版Sora——Movie Gen,就在刚刚抢先上线了! Meta将其称为「迄今最先进的媒体基础模型」。 全新上线的大杀器Movie Gen Video,是一个30B参数的Transformer模型,可以从单个文本提示,生成高质量的高清图像和视频,视频为1080P、16秒、每秒16帧。 一同推出的还有Movie Gen Audio。这是一个13B参数的Transformer模型。通过视频输入和文本提示,它就可以可控性生成和视频同步的高保真音频,时长最长45秒。 最惊人的是,这次Meta一并连论文都发布了。 论文中,详细介绍了Movie Gen的架构、训练方法和实验结果
………………………………