Mistral多模态大模型来了！120亿参数，原生支持任意大小/数量图像，公司估值已达420亿

量子位 · 公众号 · AI · 2024-09-12 11:46

文章预览

明敏发自凹非寺量子位 | 公众号 QbitAI Mistral的多模态大模型来了！ Pixtral 12B 正式发布，同时具备语言和视觉处理能力。它建立在文本模型 Nemo 12B 基础上，包含一个专门的视觉编码器。大概24GB，原生支持任意数量和尺寸的图像，大约有40层神经网络、14,336 个隐藏维度大小和32个注意力头，以及一个专用的视觉编码器，支持高分辨率图像（1024×1024）处理。发布形式还是简单直接一个种子链接。现在可以通过链接、GitHub或Hugging Face下载模型。 Mistral的开发主管表示，后续也会在Chatbot上接入模型，并提供API服务。超越Qwen、LLaVA等虽然目前模型的训练数据、细节都未公开，但是通过模型代码网友们发现了更多细节。 1、先进架构：40层网络、14336隐藏维度大小、32个注意力头。 2、视觉能力：专用视觉编码器，支持1024x1024图像大小和24个隐藏层，用于 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

人工智能那点事 · “背刺”孕期女性，发涉黄短信给准爸爸？两家母婴APP都说……

3 天前

宝玉xp · 随着 AI 编程能力提升和 AI 工具的增强，最近掀起了“人人写-20241120131523

3 天前

机器之心 · 实测昆仑万维对话AI「Skyo」，会读诗、知晓雷军摆拍

3 天前

机器之心 · Karpathy后悔了：2015年就看到了语言模型的潜力，却搞了多年强化学习

5 天前

爱可可-爱生活 · [CL]《Stronger Models are NOT Str-20241118055916

5 天前

云南高院 · 【普法强基在行动】关于偷种罂粟的这些理由，听的人“醉”了，种的人“罪”了！

4 月前

中交三航 · 防患于未“燃”，三航局开展2024年三航大厦消防疏散实战演练

1 周前