文章预览
机器之心报道 作者:泽南 两款 Step 系列开源多模态大模型,性能位列开源多模态全行业第一。 本周二,国内 AI 创业公司阶跃星辰和吉利汽车集团宣布联合开源两款多模态大模型。 这两款大模型分别是视频生成模型 Step-Video-T2V 和行业内首款产品级开源语音交互模型 Step-Audio。根据官方的测评报告,目前 Step-Video-T2V 是全球范围内参数量最大、性能最好的开源视频生成模型。 Step-Video-T2V 模型部署及技术报告链接: GitHub:https://github.com/stepfun-ai/Step-Video-T2V Hugging Face:https://huggingface.co/stepfun-ai/stepvideo-t2v Modelscope:https://modelscope.cn/models/stepfun-ai/stepvideo-t2v 技术报告:https://arxiv.org/abs/2502.10248 和此前引爆全球科技界的 DeepSeek R1 一样,阶跃星辰的 Step-Video-T2V 视频生成模型,采用最为宽松的 MIT 许可协议,支持免费商用、任意修改和衍生开发,为开源社区带来
………………………………