文章预览
视频生成领域的竞争很激烈,Pika、Sora、Luma AI、国内的可灵等,多模态、视频生成甚至也被视为大模型发展的某种必经之路。 但相比文本生成,视频生成模型当前距离场景落地似乎更远,2 月份引起轰动 Sora 迄今还没有向公众开放试用。 而在视频生成之外,视频理解反倒是距离落地更快,现阶段也频繁吸引投资的领域。 今天介绍的这家初创企业 Twelve Labs,就是其中的代表企业,还拿到了英伟达的投资。 他们的目标是, 让视频的处理和搜索变得和文本一样容易 。 「Sense AI 观点」 场景式视频内容理解是主流:增加视频数据和高质量视频内容是未来 AIGC 在媒体和娱乐领域规模化采用的基础,场景式理解视频内容 (Context Understanding of Video) 将会成为技术主流。视频内容处理可以细化到每一个瞬间,大大提高了视频内容在不同社交平台的传播效率。 AI原
………………………………