专栏名称: 斌叔OKmath
橙旭园CEO 教育博主 教育部双创优秀导师。前微软员工。橙旭园儿童编程创始人。
目录
相关文章推荐
今天看啥  ›  专栏  ›  斌叔OKmath

这个试下来效果不错,非常实时,而且是开源的。Ultravox 是-20241119083234

斌叔OKmath  · 微博  ·  · 2024-11-19 08:32
    

文章预览

2024-11-19 08:32 本条微博链接 这个试下来效果不错,非常实时,而且是开源的。 Ultravox 是一种新型的多模态 LLM,它可以理解文本和人类语音,而无需单独的音频语音识别 (ASR) 阶段。在AudioLM、SeamlessM4T、Gazelle、SpeechGPT等研究的基础上,Ultravox 能够使用多模态投影仪扩展任何开放重量 LLM,该投影仪将音频直接转换为 LLM 使用的高维空间。我们已经在 Llama 3、Mistral 和 Gemma 上训练了版本。这种直接耦合使 Ultravox 的响应速度比结 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览