主要观点总结
Genmo公司发布了最新的开源视频生成模型Mochi 1,该模型在运动质量、提示遵循性和人类渲染方面表现出色,但与一些领先的闭源竞争者相比仍有一些瑕疵。Mochi 1基于非对称扩散变换器架构构建,拥有100亿个参数,是目前公开发布的最大规模的开源视频生成模型。此外,其他AI公司也在同一时间发布了新的技术或产品。
关键观点总结
关键观点1: Mochi 1模型的发布和特性
Genmo公司发布了最新的开源视频生成模型Mochi 1,宣称在运动质量、提示遵循性和人类渲染方面表现出色,甚至超越恐怖谷。但实测发现存在眨眼动作不自然、手部动作轻微扭曲等问题。
关键观点2: Mochi 1与竞争对手的比较
Mochi 1在与一些领先的闭源竞争者的比较中表现不俗,甚至在某些方面更胜一筹。但在处理复杂运动的场景时可能会出现轻微的视觉扭曲。
关键观点3: Mochi 1的技术细节和开源特性
Mochi 1基于Genmo的非对称扩散变换器架构构建,拥有100亿个参数,是目前最大的开源视频生成模型。它采用了视频变分自编码器技术,能够降低终端用户的设备内存需求。现在可以在Hugging Face平台上免费获取完整的模型权重和代码。
关键观点4: 其他AI公司的更新和新产品
在Genmo发布Mochi 1的同时,其他AI公司也发布了新的技术或产品,包括Runway的Act One功能、Anthropic的Claude 3.5 Sonnet和Haiku模型、OpenAI的高级语音功能、Perplexity的推理模式以及Stability AI的Stable Diffusion 3.5模型等。
文章预览
AI好好用报道 编辑:杨文 目前发布的最大的开源视频生成模型。 Genmo 当了一回「赛博菩萨」。 昨晚,AI 视频生成公司 Genmo 推出了最新的视频生成模型 Mochi 1 ,并且大手一挥,直接给开源了 。 Genmo 在社交媒体上高调宣布: Mochi 1 在运动质量、提示遵循性和人类渲染方面表现出色,甚至超越恐怖谷。 同时,它还声称,在内部测试中,Mochi 1 已经能与 Runway、Luma 、可灵等领先的闭源竞争者打个平手,甚至略胜一筹。 为了让网友体验一波 Mochi 1 ,Genmo 还提供了一个在线网址。 链接: https://www.genmo.ai/play 不过,每6小时仅有 2 次免费生成机会,且用且珍惜吧。 不少网友得知消息后,已经按耐不住整活的热情。 那么,它的效果到底咋样? 先来瞅瞅官方放出来的视频 demo,稍后我们奉上一手实测。 -1- 一手实测 要说 Mochi 1 最大的优势,就在于其高保真运动
………………………………