智驾公司下场搞AI视频生成，模型上线即开源

AI好好用 · 公众号 · AI · 2024-12-18 12:14

主要观点总结

国内视频大模型公司图森未来发布了一款开源视频生成模型Ruyi（如意），可直接上传图片生成视频，无需输入提示词。该模型基于DiT架构，利用大规模数据处理能力和模型训练优化经验，提供不同风格的视频生成，包括写实风格、影视剧照、动画风格、动物和风景等。尽管目前模型存在一些问题，如图生视频在动作流畅性和真实性的表现仍需改进，但其在视频生成领域具有广泛的应用前景。图森未来计划在后续推出更多功能和更强大的模型版本。

关键观点总结

关键观点1: 开源视频生成模型Ruyi的发布

图森未来发布了一款名为Ruyi（如意）的图生视频模型，支持任意长宽比的视频生成，具有多种功能如运动幅度控制、镜头控制等。

关键观点2: Ruyi模型的性能评价

从写实风格、影视剧照、动画风格、动物、风景等五个维度对Ruyi模型进行了测评。结果显示，Ruyi在画面一致性、动作流畅性和真实性方面表现不错，但仍存在手部畸形、多人时面部细节崩坏、不可控转场等问题。

关键观点3: 图森未来的转型和后续规划

图森未来曾是一家智能驾驶公司，今年转型进军动画与视频游戏市场，并成立生成式AI新业务部门。其利用自动驾驶领域的技术优势探索商业化机会。除了开源模型外，图森未来还计划推出更多功能和更强大的模型版本。

文章预览

AI好好用报道编辑：杨文人人免费可用。大洋彼岸，两大巨头 OpenAI 和谷歌轮番炸场。一个发布了那个传说中的 Sora，一个推出了最强视频生成模型 Veo2。不过，每月 200 美金的 Sora 上线即翻车，而好评不断的 Veo 2 则尚未对公众开放。与他们相比，国内这家视频大模型公司显得尤为豪横，直接大手一挥，将自家模型开源了。 12 月 17 日，图森未来发布了一款图生视频的开源大模型，名字很中国风，叫 Ruyi（如意）。同时，他们还将 Ruyi-Mini-7B 版本正式开源，网友们现在就可以去 Hugging Face 上下载使用。 Hugging Face 模型链接： https://huggingface.co/IamCreateAI/Ruyi-Mini-7B GitHub 代码链接： https://github.com/IamCreateAI/Ruyi-Models 为了让网友们能够快速上手，他们还提供了部署说明和 ComfyUI 工作流，网友只需在消费级显卡（例如 RTX 4090）上运行即可。不要钱就能上手 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

黄建同学 · Jim Fan 大佬关于Genisis（网页链接）的赞赏↓如果一-20241221175323

昨天

宝玉xp · ChatGPT Team 订阅用户现在也能用 Sora 了！ -20241219133312

3 天前

机器之心 · 历时2年，华人团队力作，震撼开源生成式物理引擎Genesis，可模拟世界万物

3 天前

宝玉xp · 总结得好👍//@蝈蝈俊:可控（不要庞大，职责单一），兜底（测试-20241218143522

4 天前

宝玉xp · Google 的新玩具 Whisk，可以简单的用图片组合生成新的-20241217014607

5 天前

雪球 · 既然目前现状改变不了，作为投资者来说，适应大环境，学巴菲特做一个-20240624153117

6 月前

通商律师事务所 · 业绩 | 通商助力如祺出行于香港联交所主板上市

5 月前

各地薪资详解 · 湖北仙桃市公务员降薪后工资

3 月前

INSIGHT视界 · 美国歌坛天后穿双恨天高登长城惊呆网友！后来，她实在撑不住了....

3 月前

INSIGHT视界 · 美国歌坛天后穿双恨天高登长城惊呆网友！后来，她实在撑不住了....

3 月前