专栏名称: TsinghuaNLP
清华大学自然语言处理与社会人文计算实验室,是中国中文信息学会计算语言专业委员会和中国人工智能学会不确定性专业委员会的挂靠单位。负责人为清华大学计算机科学与技术系孙茂松教授,核心骨干为刘洋副教授,刘知远助理教授。
今天看啥  ›  专栏  ›  TsinghuaNLP

MiniCPM-V 2.5:登顶HuggingFace和GitHub Trending榜双榜首

TsinghuaNLP  · 公众号  ·  · 2024-05-23 15:13
    

文章预览

时隔 1 个月, 面壁智能和清华大学自然语言处理实验室联合研发的小钢炮端侧模型 MiniCPM 系列上新,带来  MiniCPM-Llama3-V 2.5 ,最强端侧多模态模型。 通过一系列自研技术,小钢炮系列开创的高清图像识别(1344 * 1344分辨率)、强大 OCR 能力等,仍得到延续。 8B 体量的新一代 MiniCPM-Llama3-V 2.5,仍带来一系列惊艳亮点。 最强端侧多模态综合性能 : 超越多模态巨无霸 Gemini Pro 、GPT-4V OCR 能力 SOTA! 180 万 像素更清晰,难图长图长文本精准识别 量化后仅  8G显存 ,4070 显卡轻松推理,并可在手机端以  6-8tokens/s  速度高效运行; 图像编码快  150 倍 !首次端侧系统级多模态加速; 支持  30+  多种语言 M iniCPM-Llama3-V 2.5 发布后火速 登顶 HuggingFace 和 GiHub Trending榜双榜首 ,与 Meta、微软、谷歌等科技巨头共同从全球 66 万模型中脱颖而出。 当前 MiniCPM-V 系列下 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览