专栏名称: Founder Park
来自极客公园,专注与科技创业者聊「真问题」。
今天看啥  ›  专栏  ›  Founder Park

欧洲名将 Mistral 发布首个多模态模型,12B 开源下载,黄仁勋站台

Founder Park  · 公众号  ·  · 2024-09-12 19:59
    

文章预览

法国 AI 初创 Mistral AI,又扔出一条磁力链炸场了。 这次,与以往不同的是,他们发布了首个多模态模型 Pixtral 12B,集语言、视觉能力于一身。 这意味着,Mistral AI 正式跨界 MMML,开启多模态 AI 新时代,同时向 OpenAI、Anthropic 等劲敌发起挑战。 多模态 Pixtral 12B,是基于文本模型 Nemo 12B 完成训练。 与 GPT-4o、Claude 类似,只需上传一张图、提供一个链接,模型就能根据提示回答问题。 它不仅能够识别复杂手写笔记,还能看懂数学公式、图表等等。 在多项基准测试(文本、指令跟随、多模态)中,新模型性能大幅超越 Qwen2 7B、Phi-3 Vision 开源模型。 Hug ging F ace 技术负责人发现此处列举的 Qwen 的数据问题很大 相较于闭源模型,Pixtral 12B 在图表问答、文档问答、视觉数学推理、大学水平多学科等基准中,性能碾压 Claude3 Haiku、Gemini 1.5 8B。 除了大约 24GB 的磁 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览