阶跃同时开源视频生成+实时语音模型，我愿称之「多模态界的Deepseek」

夕小瑶科技说 · 公众号 · · 2025-02-18 13:50

文章预览

说真的，DeepSeek 让中国的开源大模型在全世界杀疯了。就在刚刚，阶跃也宣布联合吉利汽车集团开源了两个最新的模型 —— 一个是视频生成模型 Step-Video-T2V，一个是支持实时语音对话的语音模型 Step-Audio 。一发布就迅速在推特上火了，来自 HuggingFace 的工程师称这是下一个 DeepSeek，HuggingFace 官号和 CEO 也都转发了这个 post。从官方自测效果来看，非常惊艳。重点是，这俩模型全都开源了。而且，在「跃问」APP 上，都能免费不限次的用。好家伙，一个视频，一个语音，妥妥的多模态最具挑战的两大赛道。不过，看到是「多模态卷王」阶跃星辰发布的，我也就不意外了。先来看下 Step-Video-T2V 这个视频生成参数量怪兽。 Ps：跃问 App 和跃问网页端都能免费不限次生成。传送门： https://yuewen.cn/videos 我如果没记错的话，上一届开源最大的还是 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

新京报书评周刊 · 如何培养一个不会把大部分家务都推给伴侣的男孩？

23 小时前

蓝钻故事 · 山西这次火出圈了

10 小时前

码易编程 · 推荐算法必备，Python怎样实现中文分词，计算不同句子之间的相似度

9 月前

深圳新闻网 · 刚刚，集体暴涨！仅20分钟就……

5 月前

中国土木工程集团有限公司 · 年底冲刺│中国土木全面掀起建设热潮②

3 月前

郓城融媒体中心 · 郓城县东城初级中学：青春志愿行，情暖夕阳映余晖

5 天前