文章预览
Mistral AI 和 NVIDIA 今天发布了一种新的尖端语言模型 Mistral NeMo 12B,开发人员可以轻松定制和部署,支持聊天机器人、多语言任务、编程和摘要 通过将 Mistral AI 在训练数据方面的专业知识与 NVIDIA 优化的硬件和软件生态系统相结合,Mistral NeMo 模型为各种应用提供了高性能 以下是Mistral官宣全文: Mistral NeMo 今天,我们很高兴发布与 NVIDIA 合作构建的 120 亿参数模型 Mistral NeMo。Mistral NeMo 拥有高达 128k Tokens 的大上下文窗口,在推理、世界知识和编码准确性方面在同类模型中处于领先地位。由于采用了标准架构,Mistral NeMo 使用方便,可以直接替代任何使用 Mistral 7B 的系统。 为了促进研究人员和企业的采用,我们在 Apache 2.0 许可证下发布了预训练基准和指令微调的模型检查点。Mistral NeMo 在训练时考虑了量化,使其能够在不降低性能的情况下进行 FP8 推理。
………………………………