主要观点总结
文章主要讨论了AI在生成体操视频时的挑战和困境。尽管AI模型完成度很高,但在生成体操视频时常常出现问题。文章分析了AI在理解物理规律、生物力学和美学方面的难点,并指出体操是AI视频生成的最残酷的图灵测试。文章还提到了当前学术界正在尝试的一些解决方案,但距离真正解决这一问题还有很长的路要走。
关键观点总结
关键观点1: AI在生成体操视频时存在困难。
尽管AI模型具有很高的完成度,但在生成体操视频时常常翻车,无论是幅度小的动作还是大幅度的动作都存在生成失败的情况。
关键观点2: 体操是AI视频的最残酷的图灵测试。
文章指出体操运动的复杂性使得AI在生成视频时面临三重难度:物理难点、生物力学难点和美学难点。
关键观点3: AI在理解物理规律、生物力学和美学方面存在局限。
文章详细解释了AI在生成体操视频时,因为不理解物理规律、人体生物力学和美学标准而导致的错误和局限。
关键观点4: 当前解决方案的探索与困境。
文章提到学术界正在尝试引入物理引擎模拟和在损失函数中加入物理规律约束等解决方案,但这些都还在探索阶段,距离真正解决问题还有很长的路要走。
关键观点5: AI的理解深度与未来展望。
文章最后提到,通向AGI的路或许比我们想象的还要远,但终点一定值得期待。需要AI不仅“完美模仿”,更要理解现实世界的深层规律。
文章预览
12月10日Sora全网上线,大家也都测试了很多了。 坦率的讲, 产品完成度很高,但是模型质量,真的有点不及预期。 不过今天不是来聊Sora模型的。 而是,昨天白天测试Sora的时候,生成的一段让我发了很久的呆的体操视频。 就是这个。 在前面5秒,她蓄势抬手的时候,一切都还能看。 直到真的想做动作时,一切都变得鬼畜了起来。 画面瞬间崩塌,甚至跟异形无异。 在发呆之后,同时又陷入了深思。 在我这玩AI视频的一年里面,体操,好像永远都是所有AI视频的噩梦。 不管是Sora、Luma,还是可灵、Runway等等,在生成体操视频时都会翻车。 有的翻车翻的比较温柔,因为他们动作幅度小。 有的翻车翻得比较大,直接让运动员在空中扭曲变形。 体操运动,就是AI视频最残酷的图灵测试。 当年大家都在用威尔斯吃面来衡量AI视频,但其实,体操才是真正的
………………………………