文章预览
2024-09-19 08:44
本条微博链接
今天,我们发布了几个 Moshi 成果:一份很长的技术报告,其中包含我们模型背后的所有细节、Moshi 及其 Mimi 编解码器的权重,以及 Pytorch、Rust 和 MLX 中的流式推理代码。更多详细信息请见下文🧵 ⬇️ Paper: 网页链接 Repo: 网页链接 HuggingFace: 网页链接 Moshi 由三个主要组件组成:Helium(基于 2.1T 标记训练的 7B 语言模型)、Mimi(用于对语义和声学信息进行建模的神经音频编解码器)以及新的多流
………………………………