今天看啥  ›  专栏  ›  Founder Park

又有大模型公司开源!阶跃星辰首次开源 Step 系列多模态大模型

Founder Park  · 公众号  ·  · 2025-02-18 11:48
    

文章预览

大模型开源力量又加一员!阶跃星辰今天开源了他们的视频生成模型Step-Video-T2V和语音模型Step-Audio。 根据技术报告中的评测结果,阶跃 Step-Video-T2V 的参数量和模型性能目前在全球开源视频生成领域都处于领先水平;而阶跃 Step-Audio 则是业内首款产品级的开源语音交互模型。目前,已经可以在跃问 App 内体验。 以下内容来自官方稿件。 01  阶跃 Step-Video-T2V: 更好的开源视频生成大模型 阶跃 Step-Video-T2V 模型的参数量达到 300 亿,可以直接生成 204 帧、540P 分辨率的高质量视频,这意味着能确保生成的视频内容具有极高的信息密度和强大的一致性。从我们获得的测评结果来看, 它是目前全球范围内参数量最大、性能最好的开源视频生成大模型。 为了对开源视频生成模型的性能进行全面评测,我们发布并开源了针对文生视频质量评测的新基准数据集 Step- ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览