专栏名称: 集智书童
书童带你领略视觉前沿之美,精选科研前沿、工业实用的知识供你我进步与学习!
今天看啥  ›  专栏  ›  集智书童

手机上的 GPT-4V 级多模态大型语言模型!

集智书童  · 公众号  ·  · 2024-08-18 09:00

文章预览

备注好友: 方向-学校/公司-姓名/昵称 【AIGC 先锋科技】交流群 近年来,多模态大型语言模型(MLLMs)的爆发性增长已经从根本上改变了AI研究和产业的前景,为作者揭示了迈向下一个AI里程碑的光明道路。然而,由于运行具有大量参数和巨大计算成本的MLLM的成本高昂,使得其在大规模实际应用中面临巨大挑战。最为突出的挑战来自于运行具有大量参数和巨大计算成本的MLLM的高昂成本。因此,大部分的MLLM需要部署在高性能云端服务器上,这极大地限制了它们的应用范围,例如移动设备、离线、能源敏感和隐私保护场景。 在这篇论文中,作者提出了MiniCPM-V,这是一个系列的端侧设备上高效部署的MLMs。通过在架构、预训练和对齐中集成最新的MLLM技术,最新一代的MiniCPM-Llama3-V 2.5 具有几个显著的特点: (1)强大的性能,在11个流行基准测试中超越了GPT ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览