专栏名称: 量子位
վ'ᴗ' ի 追踪AI行业和技术动态,这里更快一步!关注我们,回复“今天”,更多大新闻等你来发现
今天看啥  ›  专栏  ›  量子位

车圈最大AI「黑马」吉利:自研语音大模型登顶,性能超SOTA 10%

量子位  · 公众号  · AI  · 2024-09-23 17:59

文章预览

贾浩楠 发自 凹非寺 量子位 | 公众号 QbitAI 语音合成大模型赛道,王者一夜易主。 最新 HAM-TTS 大模型,在发音准确性、自然度和说话人相似度上对比之前SOTA成果VALL-E,有了大幅提升。 背后的主要科研团队却是LLM赛道今年最令人意外的一匹“黑马”: 吉利汽车 。 没错,不是AI原生公司,不是传统的科技巨头,是以汽车知名但正在不断展现硬科技实力的吉利。 吉利星睿AI大模型,有什么用? 吉利自研语音大模型HAM-TTS的全称是: Hierarchical Acoustic Modeling for Token-Based Zero-Shot Text-to-Speech,直译是 基于token的零样本文字转语音分层声学建模 ,是星睿AI大模型体系下的重要一员。 顾名思义,对于智能座舱体验来说,这项技术作用在最关键的交互环节: “发音” 。 语音助手说的好不好,通常有这么几个评价指标: 发音准确度 ,通过Character Error Rate(CER)来 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览