专栏名称: 夕小瑶科技说
这里有自然语言处理、机器学习、算法的入门指导、科普与深度干货,有小夕的回忆与日常,还有最重要的:萌!气!
今天看啥  ›  专栏  ›  夕小瑶科技说

阶跃同时开源视频生成+实时语音模型,我愿称之「多模态界的Deepseek」

夕小瑶科技说  · 公众号  ·  · 2025-02-18 13:50
    

文章预览

说真的,DeepSeek 让中国的开源大模型在全世界杀疯了。 就在刚刚,阶跃也宣布联合吉利汽车集团 开源 了 两个最新的模型 —— 一个是视频生成模型 Step-Video-T2V, 一个是支持实时语音对话的语音模型 Step-Audio 。 一发布就迅速在推特上火了,来自 HuggingFace 的工程师称这是下一个 DeepSeek,HuggingFace 官号和 CEO 也都转发了这个 post。 从官方自测效果来看,非常惊艳。重点是, 这俩模型全都开源了。 而且,在「跃问」APP 上,都能免费不限次的用。 好家伙,一个视频,一个语音,妥妥的多模态最具挑战的两大赛道。 不过,看到是「多模态卷王」阶跃星辰发布的,我也就不意外了。 先来看下 Step-Video-T2V 这个视频生成参数量怪兽。 Ps: 跃问 App 和 跃问网页端 都能免费不限次生成。 传送门: https://yuewen.cn/videos 我如果没记错的话,上一届开源最大的还是 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览