专栏名称: AIGC开放社区
专注AIGC(生成式人工智能)领域的专业社区,关注GPT-4、百度文心一言、华为盘古等大语言模型(LLM)的发展应用和落地,以及国内LLM的发展和市场研究,社区秉承共建、共享、开放的理念,提供对社区会员有价值的商业化思路和服务。
今天看啥  ›  专栏  ›  AIGC开放社区

超GPT-4o,1240亿参数!最强开源多模态模型 Pixtral Large!

AIGC开放社区  · 公众号  · AI 科技自媒体  · 2024-11-19 03:48

主要观点总结

本文介绍了AIGC领域的专业社区动态,包括开源大模型平台Mistral.ai发布超大多模态模型Pixtral Large及相关AI助手le Chat。Pixtral Large模型拥有强大的能力,在多个基准测试中表现优异。同时,le Chat提供了多种功能,包括网络搜索和引用、Canvas创意工作、处理大型复杂PDF和图像文档等。通过集成先进技术,le Chat实现了高效的工作流管理和自动化操作。

关键观点总结

关键观点1: Mistral.ai开源了超大多模态模型Pixtral Large

Pixtral Large有1240亿参数,支持128K上下文,能理解文本、图表、图像等,并在多个基准测试中表现优秀。

关键观点2: Pixtral Large的核心是多模态解码器和视觉编码器

多模态解码器整合处理来自视觉编码器的图像信息和文本数据,而视觉编码器则将图像转换为模型可以理解的高维特征表示。

关键观点3: le Chat是一个多模态AI助手

le Chat提供了多种功能,包括网络搜索和引用、Canvas创意工作、处理大型复杂PDF和图像文档等。通过集成先进技术,实现了高效的工作流管理和自动化操作。


文章预览

专注AIGC领域的专业社区,关注微软 、百度文心一言、讯飞星火等大语言模型(LLM)的发展和 应用 落地,聚焦LLM的市场研究和AIGC开发者生态,欢迎关注! 今天凌晨,法国著名开源大模型平台Mistral.ai,开源了超大多模态模型——Pixtral Large。 Pixtral Large有1240亿参数,支持128K上下文,能理解文本、图表、图像等,也是Mistral.ai自家聊天助手 le Chat目前正在使用的视觉模型。支持中文、法文、英文等十多种主流语言。 根据测试数据显示,Pixtral Large在MMMU、MathVista、ChartQA、DocVQA、VQAv2等基准测试的数据,超过了GPT-4o、Gemini-1.5 Pro、Claude-3.5 Sonnet、Llama-3.2 90B,成为目前最强的开源多模态模型。 同时,Mistral.ai还发布了一个免费的支持PDF理解、网络搜索、Canvas、AI Agent、图片生成的多模态AI助手——le Chat。 开源地址:https://huggingface.co/mistralai/Pixtral-Large-Instruct-2411 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览