专栏名称: 数字生命卡兹克
反复横跳于不同的AI领域,努力分享一些很酷的AI干货
今天看啥  ›  专栏  ›  数字生命卡兹克

体操运动,是所有AI视频最残酷的图灵测试。

数字生命卡兹克  · 公众号  ·  · 2024-12-11 09:00
    

主要观点总结

文章讨论了AI在生成体操视频时的困难与挑战。文章指出,尽管AI产品完成度很高,但在面对体操这种复杂运动时,模型质量常常不及预期。文章通过深入分析体操运动的难度和AI面临的挑战,包括物理规律、生物力学和美学标准等方面,阐述了AI在生成体操视频时的困境。同时,文章也提到了学术界正在尝试的解决方案和通往AGI的路的遥远与期待。

关键观点总结

关键观点1: 体操是AI视频的噩梦,涉及复杂的物理规律、生物力学和美学标准。

文章指出体操运动的复杂性,包括瞬间的力量爆发、空中旋转等动作,对于AI来说是非常地狱级别的难点。AI面临理解物理规律、生物力学原理和美学标准的挑战。

关键观点2: AI在生成体操视频时面临三重难度。

文章详细阐述了这三重难度:物理难点、生物力学难点和美学难点,这些难度使得AI在生成体操视频时经常犯错,如画面崩塌、动作不流畅等。

关键观点3: AI在模仿背后的规律时存在理解深度不足的问题。

文章认为AI只是在模仿人类的行为,而没有真正理解背后的物理规律、生物力学原理和美学标准。这导致了AI在生成一些复杂动作时,会犯下致命错误。

关键观点4: 学术界正在尝试解决方案,但通往AGI的路仍很遥远。

文章提到一些前沿的学术界正在尝试引入物理引擎模拟等技术来改进AI的表现,但离真正的世界模拟器还有很长的路要走。


文章预览

昨天Sora全网上线,大家也都测试了很多了。 坦率的讲, 产品完成度很高,但是模型质量,真的有点不及预期。 不过今天不是来聊Sora模型的。 而是,昨天白天测试Sora的时候,生成的一段让我发了很久的呆的体操视频。 就是这个。 在前面5秒,她蓄势抬手的时候,一切都还能看。 直到真的想做动作时,一切都变成的鬼畜了起来。 画面瞬间崩塌,甚至跟异形无异。 在发呆之后,同时又陷入了深思。 在我这玩AI视频的一年里面,体操,好像永远都是所有AI视频的噩梦。 不管是Sora、Luma,还是可灵、Runway等等,在生成体操视频时都会翻车。 有的翻车翻的比较温柔,因为他们动作幅度小。 有的翻车翻得比较大,直接让运动员在空中扭曲变形。 体操运动,就是AI视频最残酷的图灵测试。 当年大家都在用威尔斯吃面来衡量AI视频时,但其实,体操才是真正 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览