文章预览
点击“ 计算机视觉life ”,选择“星标” 机器人AI干货第一时间送达 论文信息 题目:Self-Adapting Large Visual-Language Models to Edge Devices across Visual Modalities 作者:Kaiwen Cai, Zhekai Duan, Gaowen Liu, Charles Fleming, Chris Xiaoxuan Lu 机构: 英国伦敦大学学院 MAPS Lab、 美国Cisco研究院、 英国爱丁堡大学 原文链接:https://arxiv.org/abs/2403.04908v2 源码链接:https://github.com/ramdrop/edgevl 编译:zty@计算机视觉life 内容速览 EdgeVL是 首个系统性地解决大型VL模型适应边缘设备的框架 ,支持在 不依赖手动注释 的情况下使用多种视觉模态。 EdgeVL能够 从预训练的VL模型转移视觉语言对齐能力到紧凑的视觉模型 ,消除了对注释的需求。 作者 整合了量化感知训练和对比学习损失 ,这种方法不仅在量化后保持了特征表示的质量,而且还显著提高了模型在不同视觉模态中的辨别能力。 摘要 随着
………………………………