专栏名称: AI算法与图像处理
考研逆袭985,非科班跨行AI,目前从事计算机视觉的工业和商业相关应用的工作。分享最新最前沿的科技,共同分享宝贵的资源资料,这里有机器学习,计算机视觉,Python等技术实战分享,也有考研,转行IT经验交流心得
今天看啥  ›  专栏  ›  AI算法与图像处理

【显存优化良药】一文搞懂大模型压缩技术

AI算法与图像处理  · 公众号  ·  · 2024-07-23 17:00

文章预览

深度学习在计算机视觉任务上应用广泛,由于模型越来越庞大且计算密集,限制了其在资源受限设备上的应用。模型压缩技术通过减少模型大小、降低计算复杂度,使得深度学习模型能够在保持性能的同时,更适合于移动设备和边缘计算场景。这些技术包括权重剪枝、量化、知识蒸馏等,它们优化模型结构和参数,减少冗余,加速推理过程,同时尽量保持 计算机视觉 任务的准确性和效率。 同时大模型时代,模型参数量更是动辄百亿,甚至千亿,比如 GPT-3 的参数量达到了 1750 亿。 1750 亿个参数,如果采用 fp16 存储,那么模型的大小约为 325.5 G 。现有最强的计算平台也很难满足其显存要求。 因此,模型 “瘦身”已经成了工业界必要的技术,只不过它有一个更正式的名字,叫 模型压缩 。 模型压缩技术 采用如 量化和稀疏 等策略,优化了深度神经网 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览