专栏名称: 智见AGI
神州问学公众号是围绕生成式AI技术的交流社区,与开发者和合作伙伴共同探究有深度的生成式AI技术前沿洞见、技术迭代、案例解析、方法和实践,助力企业的数字化转型
今天看啥  ›  专栏  ›  智见AGI

最难方言温州话被攻克!中国电信语音大模型支持30种方言,这题GPT-4o可不会做啊

智见AGI  · 公众号  ·  · 2024-05-29 17:45
    

文章预览

来源 | 量子位 更适配中文的 语音大模型 来了—— 来自中国电信人工智能研究院,AI领域Fellow大满贯科学家李学龙带队,发布首个能听懂30多种多方言混说的大模型。 号称最难方言、“魔鬼的语言”的温州话,也不在话下。 还有超自然的语音生成能力。 在2024智算云生态大会上, 星辰语音大模型 被官宣发布并开源。 要知道,当前语音模型开源开放本来就少,而针对方言更是特定方言特定模型。 开源且支持30种方言,有且只有星辰这么一个。 作为首个完成大语言模型的研发且开源的央企,中国电信现在又在语音模态领域秀起了肌肉。 首个支持30种方言混说语音大模型 那就来说道此次发布的能支持最多方言的语音大模型,核心功能主要体现在 识别 上—— 它打破了单一模型只能识别特定单一方言的困境,可同时识别理解粤语、上海话、四川话、温 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览