今天看啥  ›  专栏  ›  机器之心

从威尔・史密斯鬼畜吃面到「Her」,这些幕后技术正在推动AI视频时代的到来

机器之心  · 公众号  · AI  · 2024-10-17 17:29

主要观点总结

文章介绍了AI视频生成技术的发展以及挑战,重点讲述了豆包·视频生成模型的技术支撑和背后的技术原理,包括算力、编解码技术、框架层的挑战及解决方案,以及火山引擎的相关技术和产品,如视频转码专用芯片、BVC2智能混合编解码方案、BMF框架等。同时,文章还提到了视频正成为人类的第二语言,以及AI视频时代的其他相关技术发展趋势。

关键观点总结

关键观点1: AI视频生成技术的发展和挑战

文章概述了AI视频生成技术的现状和发展趋势,指出该技术面临的挑战,包括算力、编解码技术和框架层的困难。

关键观点2: 豆包·视频生成模型的技术支撑

文章详细介绍了豆包·视频生成模型的技术底座,包括算力层、编解码算法层和框架层的创新,以及火山引擎的相关技术和产品。

关键观点3: 视频成为人类的第二语言

文章指出视频正成为人类的第二语言,并介绍了一些新的视频技术如实时音视频技术、数字分身等,展示了视频技术的广泛应用和未来发展前景。


文章预览

机器之心原创 作者:张倩 还记得「威尔・史密斯吃意大利面」的 AI 鬼畜视频吗?在这些视频里,威尔・史密斯的面部表情、动作都非常夸张,还充满了扭曲、变形。 一年多以前,大部分 AI 视频生成模型确实只能达到这样的水平。但如今,情况完全不同了:AI 不仅能让表情、动作和光影都非常自然,还能运用丰富的镜头语言,生成的视频具有电影级别的质感。 这种让国外网友都大呼「有用」的生成效果来自字节跳动前段时间发布的豆包・视频生成模型。在开启内测后,机器之心也进行过测试,效果非常惊艳(参见《 终于拿到内测!豆包 - PixelDance 真是字节视频生成大杀器 》)。 回想今年年初 Sora 问世之际,国内 AI 社区还弥漫着一种悲观的情绪,觉得 AI 视频生成门槛颇高,国内企业想弯道超车难度不小。然而令人意外的是,Sora 高开低走,迟迟 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览