从威尔・史密斯鬼畜吃面到「Her」，这些幕后技术正在推动AI视频时代的到来

机器之心 · 公众号 · AI · 2024-10-17 17:29

主要观点总结

文章介绍了AI视频生成技术的发展以及挑战，重点讲述了豆包·视频生成模型的技术支撑和背后的技术原理，包括算力、编解码技术、框架层的挑战及解决方案，以及火山引擎的相关技术和产品，如视频转码专用芯片、BVC2智能混合编解码方案、BMF框架等。同时，文章还提到了视频正成为人类的第二语言，以及AI视频时代的其他相关技术发展趋势。

关键观点总结

关键观点1: AI视频生成技术的发展和挑战

文章概述了AI视频生成技术的现状和发展趋势，指出该技术面临的挑战，包括算力、编解码技术和框架层的困难。

关键观点2: 豆包·视频生成模型的技术支撑

文章详细介绍了豆包·视频生成模型的技术底座，包括算力层、编解码算法层和框架层的创新，以及火山引擎的相关技术和产品。

关键观点3: 视频成为人类的第二语言

文章指出视频正成为人类的第二语言，并介绍了一些新的视频技术如实时音视频技术、数字分身等，展示了视频技术的广泛应用和未来发展前景。

文章预览

机器之心原创作者：张倩还记得「威尔・史密斯吃意大利面」的 AI 鬼畜视频吗？在这些视频里，威尔・史密斯的面部表情、动作都非常夸张，还充满了扭曲、变形。一年多以前，大部分 AI 视频生成模型确实只能达到这样的水平。但如今，情况完全不同了：AI 不仅能让表情、动作和光影都非常自然，还能运用丰富的镜头语言，生成的视频具有电影级别的质感。这种让国外网友都大呼「有用」的生成效果来自字节跳动前段时间发布的豆包・视频生成模型。在开启内测后，机器之心也进行过测试，效果非常惊艳（参见《终于拿到内测！豆包 - PixelDance 真是字节视频生成大杀器》）。回想今年年初 Sora 问世之际，国内 AI 社区还弥漫着一种悲观的情绪，觉得 AI 视频生成门槛颇高，国内企业想弯道超车难度不小。然而令人意外的是，Sora 高开低走，迟迟 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博