专栏名称: 第一财经YiMagazine
这里是《第一财经周刊》读者俱乐部,我们为你发掘精彩的商业价值,也邀请你一起探寻明亮的商业世界。
今天看啥  ›  专栏  ›  第一财经YiMagazine

大模型盘点② |Haiper :视频生成还在「GPT-2」阶段

第一财经YiMagazine  · 公众号  · 财经  · 2024-10-03 11:56

主要观点总结

本文介绍了视频生成公司Haiper的CEO缪亦舒关于视频生成的看法和该公司的发展情况,包括与Sora等公司的竞争情况、产品定位、技术路线等。同时,文章还提到了DeepMind对缪亦舒的影响以及Haiper的团队规模和发展方向。

关键观点总结

关键观点1: 视频生成目前的状态和前景

视频生成目前还处于早期阶段,各家公司在视频长度、质量、连贯性等方面存在竞争。视频生成的“ChatGPT时刻”尚未到来,需要突破技术瓶颈,才能实现大规模应用。长远来看,视频生成将朝着多模态性发展,成为AGI的一部分。

关键观点2: Haiper的技术和竞争策略

Haiper使用Latent Diffusion Model(潜在扩散模型)+Transformer进行视频生成。该公司注重社区建设,希望通过降低生成视频门槛,吸引更多用户参与创作。与Sora等公司的竞争主要围绕视频生成的质量、效率和用户体验等方面展开。

关键观点3: DeepMind对缪亦舒和Haiper的影响

缪亦舒在DeepMind的工作经历对他本人和Haiper的发展产生了积极影响。DeepMind的科研管理体系、项目领导者的远见以及团队沟通方式都对Haiper的发展有所启示。此外,DeepMind在AI领域的技术储备也为Haiper提供了技术支持。

关键观点4: Haiper的团队规模和发展方向

Haiper在伦敦和加拿大的团队规模逐渐扩大,目前共有20余人。该公司致力于构建有影响力的产品,让普通用户享受技术带来的快乐。未来,Haiper将继续探索视频生成技术的可能性,并考虑在湾区和全球范围内拓展业务。


文章预览

记者: 何昕晔 邢梦妮 编辑:吴洋洋 Key Points 视频生成的「最佳时长」仍是个待探索的问题,并非越长越好; 市场似乎存在时长派和良率派两个派别,如果说Sora是时长派的代表,位于伦敦的初创公司Haiper就是良率派; 视频生成目前只相当于语言模型的GPT-2阶段——能够生成像自然语言、视频的内容,但「内容是否有意义」的问题尚未解决; 在成为GenAI时代的TikTok之前,Haiper试图先成为GenAI时代的小红书。 视频生成的「ChatGPT时刻」究竟有没有到来? 今年2月Sora发布时,不少人认为这个时刻到来了。OpenAI使用基于Transformer的扩散模型(Diffusion Model),使得Sora的生成长度可达1分钟,当时Pika的生成时长仅为3秒,Runway也只能生成18秒的视频。而且,Sora生成的视频比Runway等模型生成的「动」得更多,看起来更像真正的运动,而非Gif图片。不过, 直到现在 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览