文章预览
整理 | 周鑫雨 王奕昕 文 | 周鑫雨 编辑 | 邓咏仪 封面来源 | VentureBeat 2024年1月,Sora炸场,多模态赛道则迎来了真正的春天。 OpenAI发布的视频模型Sora,不仅将视频生成长度的天花板从10秒抬高到了60秒,还让AI行业从大炼大语言模型,进入到新阶段:通过原生的多模态模型(而非多个单模态模型拼接),加速探索通往AGI(通用人工智能)的可能性。 在2024年的智源大会上,智源研究院不仅发布了可以生成和理解视频的原生多模态模型Emu3,还请来了两位Sora暴风眼中的人物: Aditya Ramesh ,OpenAI的多模态扛把子,图像生成模型DALL·E之父,同时也是Sora的团队负责人之一。 在2024年4月的播客访谈中,他提出,像Sora这样的模型是实现AGI的关键步骤,因为能够模拟复杂的环境和世界。 谢赛宁 ,纽约大学计算机科学助理教授。他和OpenAI Sora的另一位核
………………………………