专栏名称: 集智书童
书童带你领略视觉前沿之美,精选科研前沿、工业实用的知识供你我进步与学习!
今天看啥  ›  专栏  ›  集智书童

高效轻量级LLM | Imp模型,通过低比特量化分辨率和降低实现高通骁龙8Gen3 芯片高性能部署 !

集智书童  · 公众号  ·  · 2024-05-25 09:00
    

文章预览

通过利用大型语言模型(LLM)的能力,最近的大规模多模态模型(LMMs)在开放世界多模态理解方面展现了卓越的多功能性。然而,它们通常参数众多且计算密集,因此在资源受限的情况下适用性受限。为此,相继提出了几种轻量级LMMs,以在受限规模(例如,3B)下最大化能力。 尽管这些方法取得了鼓舞人心的成果,但它们大多数只关注设计空间的一两个方面的研究,而影响模型能力的关键设计选择尚未被彻底探讨。在本文中,作者从模型架构、训练策略和训练数据等方面对轻量级LMMs进行了系统研究。 基于作者的发现,作者获得了Imp一系列在2B 4B规模下能力极高的LMMs。 值得注意的是,作者的Imp-3B模型在所有现有相似规模的轻量级LMMs中表现稳定地超越,甚至超过了13B规模下的最先进LMMs。 通过低比特量化技术和分辨率降低技术,作者的Imp模型可以 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览