专栏名称: 财联社AI daily

财联社及科创板日报旗下产品，聚焦TMT领域，更独家、更深度。

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

阶跃星辰首次开源Step系列多模态大模型

财联社AI daily · 公众号 · 科技创业 · 2025-02-18 09:58

主要观点总结

阶跃星辰和吉利汽车集团联合宣布开源两款合作的多模态大模型：阶跃Step-Video-T2V和阶跃Step-Audio。其中，Step-Video-T2V是全球参数量最大、性能最好的开源视频生成模型；Step-Audio则是行业内首款产品级开源语音交互大模型，具备多种语音特征表达功能，用户可以在跃问APP内体验。

关键观点总结

关键观点1: 阶跃星辰和吉利汽车集团合作开源两款多模态大模型

这两大模型是阶跃Step系列的一部分，被宣布为全球范围内开源。

关键观点2: 阶跃Step-Video-T2V模型的特点和性能

这是全球参数量最大、性能最好的开源视频生成模型。参数量达到300亿，可直接生成高质量的视频。

关键观点3: 阶跃Step-Audio模型的特点和功能

作为行业内首款产品级开源语音交互大模型，它能够生成情绪、方言、语种、歌声和个性化风格的表达。模型生成的语音具有超自然、高情商等特征，并能实现高质量的音色复刻。

关键观点4: 用户体验

用户即日起可在跃问APP内体验这些新功能。

文章预览

阶跃星辰和吉利汽车集团联合宣布，将双方合作的阶跃两款Step系列多模态大模型向全球开发者开源。其中，包含目前全球范围内参数量最大、性能最好的开源视频生成模型阶跃Step-Video-T2V，以及行业内首款产品级开源语音交互大模型阶跃Step-Audio。阶跃Step-Video-T2V模型的参数量达到 300 亿，可以直接生成204帧、540P分辨率的高质量视频。阶跃Step-Audio是行业内首个产品级的开源语音交互模型，能够根据不同的场景需求生成情绪、方言、语种、歌声和个性化风格的表达，能和用户自然地高质量对话。模型生成的语音具有超自然、高情商等特征，同时也能实现高质量的音色复刻。用户即日起可在跃问APP内体验新功能。 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

创业家 · 90后王兴兴，凭啥成为任正非“座上宾”？

昨天

安徽司法 · 逐梦九天——我国商业航天抓住“黄金机遇期”

昨天

安徽司法 · 逐梦九天——我国商业航天抓住“黄金机遇期”

昨天

时代财经APP · 人形机器人持续火热！A股概念股已涨疯，杭齿前进7连板，长盛轴承2个月涨4倍

昨天

时代财经APP · 人形机器人持续火热！A股概念股已涨疯，杭齿前进7连板，长盛轴承2个月涨4倍

昨天

A股投资日历 · 投资日历：人工智能+下一个轮动方向有现在也有未来

昨天

A股投资日历 · 投资日历：人工智能+下一个轮动方向有现在也有未来

昨天

大庆日报 · “饭后百步走，能活九十九”！这说法正确吗？

2 天前

大庆日报 · “饭后百步走，能活九十九”！这说法正确吗？

2 天前

科学材料站 · 谢科予教授、李楠博士，AEM综述：锂电池驱动极端环境探索：原理、进展和前景

8 月前

不二大叔 · 新型“夫妻关系”冲上热搜，吓退无数女人：有这个癖好的男人，劝你要慎重

6 月前

清扬君 · 资生堂新年涨价：无奈之举还是另有深意？

1 月前