专栏名称: 极市平台
极市平台是由深圳极视角推出的专业的视觉算法开发与分发平台,为视觉开发者提供多领域实景训练数据库等开发工具和规模化销售渠道。本公众号将会分享视觉相关的技术资讯,行业动态,在线分享信息,线下活动等。 网站: http://cvmart.net/
今天看啥  ›  专栏  ›  极市平台

80G显存塞50个7B大模型!清华 开源增量压缩新算法,显存节省8倍

极市平台  · 公众号  ·  · 2024-12-01 22:00
    

文章预览

↑ 点击 蓝字  关注极市平台 作者丨Delta-CoMe团队 来源丨量子位 编辑丨极市平台 极市导读   最新模型增量压缩技术,一个80G的A100 GPU能够轻松加载多达50个7B模型,节省显存约8倍,同时模型性能几乎与压缩前的微调模型相当。   >> 加入极市CV技术交流群,走在计算机视觉的最前沿 清华大学NLP实验室携手OpenBMB开源社区、北京大学和上海财经大学的研究团队,提出 Delta-CoMe 。 这项技术的核心在于 利用主干模型与任务专用模型之间参数增量 (即Delta)的特点进行压缩,从而实现存储开销和部署成本的大幅降低。不仅有助于解决资源瓶颈问题,更为多任务处理和模型部署开辟新的可能。 具体而言,Delta-CoMe将低秩分解和低比特量化技术相结合,充分利用Delta参数的低秩特性,提出了一种全新的混合精度压缩方法。这种方法不仅能够实现接近无损的任务性 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览