专栏名称: 歸藏的AI工具箱
互联网科技博主 产品设计师、模型设计师、 不会代码的独立开发者。 关注人工智能、LLM 、 Stable Diffusion 和设计。
今天看啥  ›  专栏  ›  歸藏的AI工具箱

利用大型语言模型实现视觉压缩#ai# 论文提出了一种名为VoCo-20240620113235

歸藏的AI工具箱  · 微博  ·  · 2024-06-20 11:32
    

文章预览

2024-06-20 11:32 本条微博链接 利用大型语言模型实现视觉压缩 #ai# 论文提出了一种名为VoCo-LLaMA的新方法,可以利用大语言模型自身的能力来压缩图像中的视觉信息。 它在视觉指令调优阶段引入了特殊的VoCo压缩 token,通过注意力蒸馏的方式,将语言模型对视觉 token的理解迁移到对VoCo token的理解中。 这样做可以在尽量减少信息损失 ... ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览