专栏名称: 极客公园
科技创新者的大本营。汇聚优秀的产品报道、评测视频和高质量的线下活动。
今天看啥  ›  专栏  ›  极客公园

火山引擎丢出视频大模型「王炸」,云厂商从「价格战」回归「卷性能」

极客公园  · 公众号  · 科技媒体  · 2024-09-25 19:22

主要观点总结

本文主要介绍了字节跳动旗下火山引擎发布的AI创新产品,包括豆包视频生成大模型、音乐生成大模型等,以及火山引擎未来十年的发展目标。文章详细描述了豆包视频生成大模型的三大特点,以及火山引擎从“卷价格”到“卷性能”的转变。此外,还提到了模型性能的提升和AI基础设施服务商们下一阶段的重点。

关键观点总结

关键观点1: 火山引擎发布多款AI产品,包括豆包视频生成大模型和音乐生成大模型等。

火山引擎是字节跳动的ToB云平台,发布了包括豆包视频生成大模型在内的多款AI产品。这些产品在企业级应用上展示了强大的能力,尤其是豆包视频生成大模型,可以解决视频生成中的各种问题。

关键观点2: 豆包视频生成大模型的三大特点。

豆包视频生成大模型具有对复杂指令的理解遵循、运镜、一致性多镜头三大特点。它可以根据指令实现时序性上有连续的动作指令,并且可以生成多个主体,让多个主体间进行交互。同时,在视频场景的解决方案上,豆包视频模型也推出了更适配的解决方案。

关键观点3: 火山引擎从“卷价格”到“卷性能”的转变。

火山引擎开始从注重价格转变为注重性能,旨在提供更好的模型能力和服务。这一转变是对模型性能掣肘问题的回应,也是为了满足企业对模型性能的需求。未来,更好的模型性能、更好用的模型服务,将在产品上打开更多场景。

关键观点4: 模型性能的提升和AI基础设施服务商的下一阶段重点。

随着更多企业在AI应用上的探索,模型性能的定向提升带来了很多工程调优手段。大模型领域在模型预训练上做Scaling Law以提升模型性能的方法已经陷入瓶颈,但随着o1的出现以及更多技术手段的应用,模型性能有望进一步提升。这也将成为包括火山引擎在内的AI基础设施服务商们下一阶段的重点。


文章预览

更好的模型性能、更好用的模型服务,才能在产品上打开更多场景。 作者 | 宛辰 编辑  | 郑玄 自今年 2 月 Sora 面世以来,很多人都期待字节的动作。拥有抖音和剪映这两个最强的视频 App 在手,字节的视频生成大模型,被寄予厚望。 这就来了。 9 月 24 日,字节跳动旗下火山引擎在深圳举办 AI 创新巡展,一举发布了包括「豆包视频生成大模型」「音乐生成大模型」在内的多款模型。 在此之前,海内外不少现象级的同类模型产品相继发布,包括字节跳动相继发布的即梦、海绵音乐,和剪映(含 CapCut)中的新功能。秘而不宣的海绵音乐 App 更是被视为最适合中文的音乐生成 App、国内当之无愧的「Suno」。 字节为什么选择在多少有些「AI 产品看麻了」的 9 月,推出这几款 AI App 背后的大模型引擎? 对此,火山引擎总裁谭待向极客公园表示,不是按照某 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览