专栏名称: AI好好用
探索全球人工智能应用场景及商业化
今天看啥  ›  专栏  ›  AI好好用

智驾公司下场搞AI视频生成,模型上线即开源

AI好好用  · 公众号  · AI  · 2024-12-18 12:14
    

主要观点总结

国内视频大模型公司图森未来发布了一款开源视频生成模型Ruyi(如意),可直接上传图片生成视频,无需输入提示词。该模型基于DiT架构,利用大规模数据处理能力和模型训练优化经验,提供不同风格的视频生成,包括写实风格、影视剧照、动画风格、动物和风景等。尽管目前模型存在一些问题,如图生视频在动作流畅性和真实性的表现仍需改进,但其在视频生成领域具有广泛的应用前景。图森未来计划在后续推出更多功能和更强大的模型版本。

关键观点总结

关键观点1: 开源视频生成模型Ruyi的发布

图森未来发布了一款名为Ruyi(如意)的图生视频模型,支持任意长宽比的视频生成,具有多种功能如运动幅度控制、镜头控制等。

关键观点2: Ruyi模型的性能评价

从写实风格、影视剧照、动画风格、动物、风景等五个维度对Ruyi模型进行了测评。结果显示,Ruyi在画面一致性、动作流畅性和真实性方面表现不错,但仍存在手部畸形、多人时面部细节崩坏、不可控转场等问题。

关键观点3: 图森未来的转型和后续规划

图森未来曾是一家智能驾驶公司,今年转型进军动画与视频游戏市场,并成立生成式AI新业务部门。其利用自动驾驶领域的技术优势探索商业化机会。除了开源模型外,图森未来还计划推出更多功能和更强大的模型版本。


文章预览

 AI好好用报道 编辑:杨文 人人免费可用。 大洋彼岸,两大巨头 OpenAI 和谷歌轮番炸场。 一个发布了那个传说中的 Sora,一个推出了最强视频生成模型 Veo2。 不过,每月 200 美金的 Sora 上线即翻车,而好评不断的 Veo 2 则尚未对公众开放。 与他们相比,国内这家视频大模型公司显得尤为豪横,直接大手一挥,将自家模型开源了。 12 月 17 日,图森未来发布了一款图生视频的开源大模型,名字很中国风,叫 Ruyi(如意)。 同时,他们还将 Ruyi-Mini-7B 版本正式开源,网友们现在就可以去 Hugging Face 上下载使用。 Hugging Face 模型链接: https://huggingface.co/IamCreateAI/Ruyi-Mini-7B GitHub 代码链接: https://github.com/IamCreateAI/Ruyi-Models 为了让网友们能够快速上手,他们还提供了部署说明和 ComfyUI 工作流,网友只需在消费级显卡(例如 RTX 4090)上运行即可。 不要钱就能上手 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览