真·赛博菩萨！最大的开源视频模型来了，我们实测：有点东西，但不多

AI好好用 · 公众号 · AI · 2024-10-23 17:11

主要观点总结

Genmo公司发布了最新的开源视频生成模型Mochi 1，该模型在运动质量、提示遵循性和人类渲染方面表现出色，但与一些领先的闭源竞争者相比仍有一些瑕疵。Mochi 1基于非对称扩散变换器架构构建，拥有100亿个参数，是目前公开发布的最大规模的开源视频生成模型。此外，其他AI公司也在同一时间发布了新的技术或产品。

关键观点总结

关键观点1: Mochi 1模型的发布和特性

Genmo公司发布了最新的开源视频生成模型Mochi 1，宣称在运动质量、提示遵循性和人类渲染方面表现出色，甚至超越恐怖谷。但实测发现存在眨眼动作不自然、手部动作轻微扭曲等问题。

关键观点2: Mochi 1与竞争对手的比较

Mochi 1在与一些领先的闭源竞争者的比较中表现不俗，甚至在某些方面更胜一筹。但在处理复杂运动的场景时可能会出现轻微的视觉扭曲。

关键观点3: Mochi 1的技术细节和开源特性

Mochi 1基于Genmo的非对称扩散变换器架构构建，拥有100亿个参数，是目前最大的开源视频生成模型。它采用了视频变分自编码器技术，能够降低终端用户的设备内存需求。现在可以在Hugging Face平台上免费获取完整的模型权重和代码。

关键观点4: 其他AI公司的更新和新产品

在Genmo发布Mochi 1的同时，其他AI公司也发布了新的技术或产品，包括Runway的Act One功能、Anthropic的Claude 3.5 Sonnet和Haiku模型、OpenAI的高级语音功能、Perplexity的推理模式以及Stability AI的Stable Diffusion 3.5模型等。

文章预览

AI好好用报道编辑：杨文目前发布的最大的开源视频生成模型。 Genmo 当了一回「赛博菩萨」。昨晚，AI 视频生成公司 Genmo 推出了最新的视频生成模型 Mochi 1 ，并且大手一挥，直接给开源了。 Genmo 在社交媒体上高调宣布： Mochi 1 在运动质量、提示遵循性和人类渲染方面表现出色，甚至超越恐怖谷。同时，它还声称，在内部测试中，Mochi 1 已经能与 Runway、Luma 、可灵等领先的闭源竞争者打个平手，甚至略胜一筹。为了让网友体验一波 Mochi 1 ，Genmo 还提供了一个在线网址。链接： https://www.genmo.ai/play 不过，每6小时仅有 2 次免费生成机会，且用且珍惜吧。不少网友得知消息后，已经按耐不住整活的热情。那么，它的效果到底咋样？先来瞅瞅官方放出来的视频 demo，稍后我们奉上一手实测。 -1- 一手实测要说 Mochi 1 最大的优势，就在于其高保真运动 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博