文章预览
专注AIGC领域的专业社区,关注微软 、百度文心一言、讯飞星火等大语言模型(LLM)的发展和 应用 落地,聚焦LLM的市场研究和AIGC开发者生态,欢迎关注! 国内著名开源社区OpenBMB发布了最新开源多模态大模型——MiniCPM-V 2.6。 据悉,MiniCPM-V 2.6一共有80亿参数,在单图像、多图像和视频理解方面超越了GPT-4V;在单图像理解方面优于GPT-4o mini、Gemini 1.5 Pro 和 Claude 3.5 Sonnet。 值得一提的是,MiniCPM-V 2.6显著减少了模型的内存占用并提高了推理效率,首次支持iPad等端侧设备进行实时视频理解的模型。 开源地址:https://github.com/OpenBMB/MiniCPM-V 在线demo:https://huggingface.co/spaces/openbmb/MiniCPM-V-2_6 MiniCPM-V
2.6是基于SigLip-400M和阿里的Qwen2-7B模型开发而成,相比V 2.5 性能进行了大幅度更新,并引入了多图像和视频理解的特色功能。 性能超强: 在最新版本的OpenCompass上平均
………………………………