专栏名称: Hugging Face
The AI community building the future.
今天看啥  ›  专栏  ›  Hugging Face

社区供稿 | 仅8B,全面对标 GPT-4V !单图、多图、视频理解端侧三冠王!

Hugging Face  · 公众号  ·  · 2024-08-15 10:30
    

文章预览

再次刷新端侧多模态天花板,面壁「小钢炮」 MiniCPM-V 2.6 模型重磅上新! 仅8B参数, 单图、多图、视频理解全面对标 GPT-4V ! 且小钢炮一口气将 实时视频理解、多图联合理解、多图ICL等能力首次搬上端侧多模态模型。  ➤   MiniCPM-V 2.6 开源地址: GitHub:  🔗  https://github.com/OpenBMB/MiniCPM-V Hugging Face: 🔗  https://hf.co/openbmb/MiniCPM-V-2_6  ➤   llama.cpp、ollama、vllm 部署教程地址: 🔗  https://modelbest.feishu.cn/docx/Duptdntfro2Clfx2DzuczHxAnhc  ➤   MiniCPM 系列开源地址: 🔗  https://github.com/OpenBMB/MiniCPM 亮点众多,延续了「小钢炮」系列一贯的以小博大与高效低成本,划重点如下: 「三合一」最强端侧多模 态: 首次在端侧实现 单图、多图、视频理解 等多模态核心能力 全面超越 GPT-4V ,单图理解越级 比肩多模态王者   Gemini 1.5 Pro  和新晋顶流  GPT-4o mini  。 多项 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览