今天看啥  ›  专栏  ›  机器之心SOTA模型

今日开源(2024-10-24):最大开源视频生成模型Mochi 1,10B参数,每秒30帧生成最长5.4秒视频,精准多模态融合

机器之心SOTA模型  · 公众号  ·  · 2024-10-24 17:59

文章预览

🏆基座模型 ①项目:Mochi 1 ★ Mochi 1 是一款开源的先进视频生成模型,具备高保真运动和强提示词依从性。 该模型在开放视频生成系统中取得了显著进展,并在Apache 2.0许可下发布。 采用了新颖的非对称扩散transformer(AsymmDiT)架构,是迄今为止最大的视频生成模型 ,支持用户在Gradio UI或命令行界面生成视频。 ☆一键收藏: https://sota.jiqizhixin.com/project/mochi-1 ②项目:Video-XL ★ Video-XL是一个专为小时级视频理解而设计的视觉语言模型。 该项目在多个基准测试中表现出色, 能够处理长视频的视觉上下文 ,适用于电影摘要、监控异常检测和广告识别等实际场景。 ☆一键收藏: https://sota.jiqizhixin.com/project/video-xl 🤖 Agent开发 ①项目:agent.exe ★ agent.exe 是一个简单的 Electron 应用程序,允许 Claude 3.5 Sonnet 直接控制本地计算机。 用户可以通过提供的 API Key ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览