专栏名称: AI算法与图像处理
考研逆袭985,非科班跨行AI,目前从事计算机视觉的工业和商业相关应用的工作。分享最新最前沿的科技,共同分享宝贵的资源资料,这里有机器学习,计算机视觉,Python等技术实战分享,也有考研,转行IT经验交流心得
今天看啥  ›  专栏  ›  AI算法与图像处理

一个开源的TTS模型火了,参数只有82M,但榜单第一!

AI算法与图像处理  · 公众号  ·  · 2025-01-14 19:53
    

文章预览

最近,HuggingFace模型趋势榜上有一个很火的开源模型 Kokoro-82M 。 Kokoro-82M不是大模型,而是一个参数量只有82M的TTS(Text-to-Speech)模型。虽然模型不大,但是Kokoro-8 2M在TTS Arena榜单上排行第一! TTS Arena 是一个用于评估语音合成模型的平台, 其灵感来源于 LMsys 的 Chatbot Arena。 用户可以通过输入文本并对比两个模型的合成语音来投票选择更自然的结果,模型名称在投票后才会显示。该平台旨在解决语音合成领域缺乏有效质量评估方法的问题,通过公开排名使结果更透明且易于访问。虽然这个排行榜很有参考意义。 Kokoro-8 2M只 在不到 100 小时音频上进行训练,开源协议为可商用的 Apache 2.0 许可,支持多语种:英、法、日、韩、中。 开源地址:https://huggingface.co/hexgrad/Kokoro-82M 目前模型已经有在线体验链接: https://huggingface.co/spaces/hexgrad/Kokoro-TTS 下面放一些 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览