今天看啥  ›  专栏  ›  晓飞的算法工程笔记

CV&AIGC顶会速递 [2024-09-18]

晓飞的算法工程笔记  · 公众号  ·  · 2024-09-18 10:56
    

文章预览

今日更新20篇: 计算机视觉会议 16篇 自然语言处理会议 4篇 请注意,大模型的论文多发布于自然语言处理会议中。而由于多模态的发展迅速,部分计算机视觉相关的论文也会发布在自然语言处理顶会中。 计算机视觉会议: 16篇 [0] SAM4MLLM: Enhance Multi-Modal Large Language Model for Referring Expression Segmentation[cs.CV] 标题:SAM4MLLM:增强多模态大型语言模型以用于指代表达式分割 作者:Yi-Chia Chen, Wei-Hua Li, Cheng Sun, Yu-Chiang Frank Wang, Chu-Song Chen 链接:http://arxiv.org/abs/2409.10542 摘要 :我们引入了一种创新方法SAM4MLLM,该方法将Segment Anything Model(SAM)与多模态大型语言模型(MLLMs)相结合,以实现像素级任务。我们的方法使MLLMs能够在不进行过多修改现有模型架构或添加专用标记的情况下学习像素级位置信息。我们提出了一种基于查询的方法,能有效找出SAM进行基于MLLM的 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览