专栏名称: AI变革指南
分享AI大模型;分享让你高效的AI工具和应用;分享AI行业前沿资讯;关注我,一起拥抱新技术革命~
今天看啥  ›  专栏  ›  AI变革指南

比肩GPT-4o!开源的多模态“小钢炮”AI:MiniCPM-Llama3-V 2.5

AI变革指南  · 公众号  ·  · 2024-08-09 06:00

文章预览

今天介绍一个开源的多模态“小钢炮”AI:MiniCPM-Llama3-V 2.5 它单图理解能力比肩GPT-4o mini和多模态王者 Gemini 1.5 Pro! MiniCPM-Llama3-V 2.5是什么? 面壁智能的MiniCPM系列是专为端侧设备设计的多模态大模型,旨在本地电脑或者移动智能设备(手机平板)上运行。 MiniCPM-V 2.6 是 MiniCPM-V 系列中最新、性能最佳的模型。 该模型基于 SigLip-400M 和 Qwen2-7B 构建,共 8B 参数,并引入了多图和视频理解的新功能。 它具备强大的OCR能力,能够处理任意长宽比的图像,像素数可达180万(如1344x1344)。 总的来说,它具有: 多图理解和上下文学习、视频理解、 OCR 能力和多语言(英语、中文、德语、法语、意大利语、韩语等)的特点 。 性能如何? MiniCPM-V 2.6 在最新版本 OpenCompass 榜单上(综合 8 个主流多模态评测基准)平均得分 65.2! 它以8B量级的大小在单图理解方面超越 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览