8人半年肝出开源版GPT-4o，0延迟演示全网沸腾！背后技术揭秘，人人免费用

机器学习研究组订阅 · 公众号 · AI · 2024-07-04 19:13

文章预览

没想到，「开源版」GPT-4o这么快就来了！昨夜，来自法国AI实验室kyutai放出首个实时原生多模态Moshi，效果演示堪比5月发布的GPT-4o。比如下面这个demo中，Moshi作为助手帮助Alexa小哥踏上太空之旅，让人一秒幻视流浪地球中的Moss。值得一提的是，这是8人团队仅用了半年的时间，从头完成了模型的训练。 Moshi还处在实验原型阶段，设计初衷是为了理解和表达情感，能够支持听、说、看，可以用70种不同情绪和风格说话，甚至随时打断。它最为突出的一个能力是，能够同时处理两个音频流，即「听」和「说」是同时进行的。这种实时互动的实现，是基于文本和音频混合的联合预训练，用Helium中合成的文本数据，训出的70亿参数的模型。 Moshi可以实现最低160ms端到端延迟。而且，最小版本的Moshi还可以在笔记本电脑，或者消费级GPU上可跑。许多人都说这 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

编程技术进阶 · 绝了！北大团队30个落地案例，展示AI技术如何让新媒体“逆天改命”？(PDF免费下载)

8 小时前

编程技术进阶 · 绝了！北大团队30个落地案例，展示AI技术如何让新媒体“逆天改命”？(PDF免费下载)

8 小时前

黄建同学 · KREA AI推出的“视频风格重塑(转换)”Video Rest-20250412214400

2 天前

宝玉xp · 我觉得挺好的//@i陆三金:哈哈，宝玉老师删繁就简，不过简单的提-20250412122356

2 天前

爱可可-爱生活 · 【An Observation on Generalizatio-20250412074410

2 天前

新智元 · 爆火全网《猫和老鼠》背后模型竟是这家国产AI！掀二创风暴GitHub破万星

3 天前

小白测评 · vivoX200Promini机模曝光 | FindX8真机打几分？

6 月前

德立电子 · 金秋丹桂香岁岁又重阳丨德立电子祝大家重阳节喜乐安康！

6 月前

德立电子 · 金秋丹桂香岁岁又重阳丨德立电子祝大家重阳节喜乐安康！

6 月前

普益标准 · 深度丨渤银理财产品系列分析——财收有略，一枝独秀

3 月前

上海房天下 · 最新！全国全面取消限制！包括上海！

3 月前