火山引擎丢出视频大模型「王炸」，云厂商从「价格战」回归「卷性能」

极客公园 · 公众号 · 科技媒体 · 2024-09-25 19:22

主要观点总结

本文主要介绍了字节跳动旗下火山引擎发布的AI创新产品，包括豆包视频生成大模型、音乐生成大模型等，以及火山引擎未来十年的发展目标。文章详细描述了豆包视频生成大模型的三大特点，以及火山引擎从“卷价格”到“卷性能”的转变。此外，还提到了模型性能的提升和AI基础设施服务商们下一阶段的重点。

关键观点总结

关键观点1: 火山引擎发布多款AI产品，包括豆包视频生成大模型和音乐生成大模型等。

火山引擎是字节跳动的ToB云平台，发布了包括豆包视频生成大模型在内的多款AI产品。这些产品在企业级应用上展示了强大的能力，尤其是豆包视频生成大模型，可以解决视频生成中的各种问题。

关键观点2: 豆包视频生成大模型的三大特点。

豆包视频生成大模型具有对复杂指令的理解遵循、运镜、一致性多镜头三大特点。它可以根据指令实现时序性上有连续的动作指令，并且可以生成多个主体，让多个主体间进行交互。同时，在视频场景的解决方案上，豆包视频模型也推出了更适配的解决方案。

关键观点3: 火山引擎从“卷价格”到“卷性能”的转变。

火山引擎开始从注重价格转变为注重性能，旨在提供更好的模型能力和服务。这一转变是对模型性能掣肘问题的回应，也是为了满足企业对模型性能的需求。未来，更好的模型性能、更好用的模型服务，将在产品上打开更多场景。

关键观点4: 模型性能的提升和AI基础设施服务商的下一阶段重点。

随着更多企业在AI应用上的探索，模型性能的定向提升带来了很多工程调优手段。大模型领域在模型预训练上做Scaling Law以提升模型性能的方法已经陷入瓶颈，但随着o1的出现以及更多技术手段的应用，模型性能有望进一步提升。这也将成为包括火山引擎在内的AI基础设施服务商们下一阶段的重点。

文章预览

更好的模型性能、更好用的模型服务，才能在产品上打开更多场景。作者 | 宛辰编辑 | 郑玄自今年 2 月 Sora 面世以来，很多人都期待字节的动作。拥有抖音和剪映这两个最强的视频 App 在手，字节的视频生成大模型，被寄予厚望。这就来了。 9 月 24 日，字节跳动旗下火山引擎在深圳举办 AI 创新巡展，一举发布了包括「豆包视频生成大模型」「音乐生成大模型」在内的多款模型。在此之前，海内外不少现象级的同类模型产品相继发布，包括字节跳动相继发布的即梦、海绵音乐，和剪映（含 CapCut）中的新功能。秘而不宣的海绵音乐 App 更是被视为最适合中文的音乐生成 App、国内当之无愧的「Suno」。字节为什么选择在多少有些「AI 产品看麻了」的 9 月，推出这几款 AI App 背后的大模型引擎？对此，火山引擎总裁谭待向极客公园表示，不是按照某 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博