专栏名称: 极市平台

极市平台是由深圳极视角推出的专业的视觉算法开发与分发平台，为视觉开发者提供多领域实景训练数据库等开发工具和规模化销售渠道。本公众号将会分享视觉相关的技术资讯，行业动态，在线分享信息，线下活动等。网站: http://cvmart.net/

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

80G显存塞50个7B大模型！清华开源增量压缩新算法，显存节省8倍

极市平台 · 公众号 · · 2024-12-01 22:00

文章预览

↑ 点击蓝字关注极市平台作者丨Delta-CoMe团队来源丨量子位编辑丨极市平台极市导读最新模型增量压缩技术，一个80G的A100 GPU能够轻松加载多达50个7B模型，节省显存约8倍，同时模型性能几乎与压缩前的微调模型相当。 >> 加入极市CV技术交流群，走在计算机视觉的最前沿清华大学NLP实验室携手OpenBMB开源社区、北京大学和上海财经大学的研究团队，提出 Delta-CoMe 。这项技术的核心在于利用主干模型与任务专用模型之间参数增量（即Delta）的特点进行压缩，从而实现存储开销和部署成本的大幅降低。不仅有助于解决资源瓶颈问题，更为多任务处理和模型部署开辟新的可能。具体而言，Delta-CoMe将低秩分解和低比特量化技术相结合，充分利用Delta参数的低秩特性，提出了一种全新的混合精度压缩方法。这种方法不仅能够实现接近无损的任务性 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

80G显存塞50个7B大模型！清华 开源增量压缩新算法，显存节省8倍

文章预览

80G显存塞50个7B大模型！清华开源增量压缩新算法，显存节省8倍