文章预览
MLNLP 社区是国内外知名的机器学习与自然语言处理社区,受众覆盖国内外NLP硕博生、高校老师以及企业研究人员。 社区的愿景 是促进国内外自然语言处理,机器学习学术界、产业界和广大爱好者之间的交流和进步,特别是初学者同学们的进步。 转载自 | 新智元 编辑 | alan 前段时间技惊四座、剑指GPT-4o的实时语音模型Moshi,终于开源了! 自然聊天,情绪丰富,随意打断,拒绝呆板和回合制! 大神Karpathy体验之后也表示:nice~ 来自法国的初创团队Kyutai,于7月初发布了这个对标GPT-4o的神奇的端到端语音模型。 2个多月后的今天,他们兑现了自己的承诺,将代码、模型权重和一份超长的技术报告一股脑开源。 论文地址:https://kyutai.org/Moshi.pdf 开源代码:https://github.com/kyutai-labs/moshi 开放权重:https://huggingface.co/collections/kyutai 在海的那一边,GPT-4o的语音模式
………………………………