主要观点总结
阶跃星辰和吉利汽车集团联合宣布开源两款合作的多模态大模型:阶跃Step-Video-T2V和阶跃Step-Audio。其中,Step-Video-T2V是全球参数量最大、性能最好的开源视频生成模型;Step-Audio则是行业内首款产品级开源语音交互大模型,具备多种语音特征表达功能,用户可以在跃问APP内体验。
关键观点总结
关键观点1: 阶跃星辰和吉利汽车集团合作开源两款多模态大模型
这两大模型是阶跃Step系列的一部分,被宣布为全球范围内开源。
关键观点2: 阶跃Step-Video-T2V模型的特点和性能
这是全球参数量最大、性能最好的开源视频生成模型。参数量达到300亿,可直接生成高质量的视频。
关键观点3: 阶跃Step-Audio模型的特点和功能
作为行业内首款产品级开源语音交互大模型,它能够生成情绪、方言、语种、歌声和个性化风格的表达。模型生成的语音具有超自然、高情商等特征,并能实现高质量的音色复刻。
关键观点4: 用户体验
用户即日起可在跃问APP内体验这些新功能。
文章预览
阶跃星辰和吉利汽车集团联合宣布,将双方合作的阶跃两款Step系列多模态大模型向全球开发者开源。 其中,包含目前全球范围内参数量最大、性能最好的开源视频生成模型阶跃Step-Video-T2V,以及行业内首款产品级开源语音交互大模型阶跃Step-Audio。 阶跃Step-Video-T2V模型的参数量达到 300 亿,可以直接生成204帧、540P分辨率的高质量视频。 阶跃Step-Audio是行业内首个产品级的开源语音交互模型,能够根据不同的场景需求生成情绪、方言、语种、歌声和个性化风格的表达,能和用户自然地高质量对话。模型生成的语音具有超自然、高情商等特征,同时也能实现高质量的音色复刻。用户即日起可在跃问APP内体验新功能。
………………………………