今天看啥  ›  专栏  ›  阿里云

首发!阶跃星辰最新开源多模态模型上线阿里云魔搭

阿里云  · 公众号  ·  · 2025-02-21 14:42
    

文章预览

今日,在全球开发者大会(GDC)上, 阿里云魔搭社区首发阶跃星辰最新开源的两款多模态模型 ,包括 全球参数量最大的开源视频生成模型Step-Video-T2V ,以及 业界首款产品级开源语音交互模型Step-Audio 。截至目前,魔搭社区已上架超过4万个开源模型,涵盖LLM、对话、语音、文生图、图生视频等多个领域,是中国最大的AI模型社区。 图|阿里云魔搭社区官网 此次在魔搭社区开源的两款模型,是近期全球多模态领域最热门的开源模型:由阶跃星辰开源的视频生成模型Step-Video-T2V和业界首款产品级开源语音交互模型Step-Audio。 Step-Video-T2V是基于300亿参数的文本转视频预训练模型 ,能够生成高达204帧的视频,在指令遵循、运动平滑性、物理合理性、美感度等方面表现均显著超过市面上既有的开源视频模型。 图|Step-Video-T2V-Eval测评结果 另一款上架模型 Step-A ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览