专栏名称: 计算机视觉life
兼具系统性、严谨性、易读性,分享计算机视觉、机器学习、人工智能及相关领域前沿资讯、技术干货、产业理解。
今天看啥  ›  专栏  ›  计算机视觉life

伦敦大学学院、思科、爱丁堡大学开源EdgeVL!面向边缘设备的自适应视觉-语言大模型

计算机视觉life  · 公众号  ·  · 2024-08-21 11:01

文章预览

点击“ 计算机视觉life ”,选择“星标” 机器人AI干货第一时间送达 论文信息 题目:Self-Adapting Large Visual-Language Models to Edge Devices across Visual Modalities 作者:Kaiwen Cai, Zhekai Duan, Gaowen Liu, Charles Fleming, Chris Xiaoxuan Lu 机构: 英国伦敦大学学院 MAPS Lab、 美国Cisco研究院、 英国爱丁堡大学 原文链接:https://arxiv.org/abs/2403.04908v2 源码链接:https://github.com/ramdrop/edgevl 编译:zty@计算机视觉life 内容速览 EdgeVL是 首个系统性地解决大型VL模型适应边缘设备的框架 ,支持在 不依赖手动注释 的情况下使用多种视觉模态。 EdgeVL能够 从预训练的VL模型转移视觉语言对齐能力到紧凑的视觉模型 ,消除了对注释的需求。 作者 整合了量化感知训练和对比学习损失 ,这种方法不仅在量化后保持了特征表示的质量,而且还显著提高了模型在不同视觉模态中的辨别能力。 摘要 随着 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览