注册登录

专栏名称: 晓飞的算法工程笔记

work-life balance.

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

目录

相关文章推荐

常旅客专家 · 万豪又解锁新店！中国对日本等9国免签！黑五O ... · 9 小时前

常旅客专家 · 大气！万豪直接送50美元！IHG年底冲钻这样玩！ · 2 天前

地道风物 · 中国各地小孩的童年噩梦，没人能逃过最后一个 · 4 天前

旅行雷达 · 速领500元大额券！国内唯一，南航这条洲际航 ... · 6 天前

今天看啥 › 专栏 › 晓飞的算法工程笔记

CVPR'24 | ScanFormer：逐层抵达目标，基于特征金字塔的指代表达理解框架

晓飞的算法工程笔记 · 公众号 · · 2024-09-12 12:00

文章预览

指代表达理解（ REC ）旨在在图像中定位由自由形式自然语言描述指定的目标对象。尽管最先进的方法取得了令人印象深刻的性能，但它们对图像进行了密集感知，包含与语言查询无关的多余视觉区域，导致额外的计算开销。这启发论文探讨一个问题：能否消除与语言无关的多余视觉区域，以提高模型的效率？现有的相关方法主要侧重于基本的视觉任务，在视觉语言领域的探索有限。为了解决这一问题，论文提出了一个称为 ScanFormer 的粗到细的迭代感知框架。该框架逐层利用图像尺度金字塔，从上到下提取与语言相关的视觉图像块。在每次迭代中，通过设计的信息预测方法丢弃不相关的图像块。此外，论文提出了一个用于加速推断的被丢弃图像块的选择策略。在广泛使用的数据集 RefCOCO 、 RefCOCO +、 RefCOCOg 和 ReferItGame 上的实验证明了该框架有效性 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

常旅客专家 · 万豪又解锁新店！中国对日本等9国免签！黑五OTA促销低至65折！

9 小时前

常旅客专家 · 大气！万豪直接送50美元！IHG年底冲钻这样玩！

2 天前

地道风物 · 中国各地小孩的童年噩梦，没人能逃过最后一个

4 天前

旅行雷达 · 速领500元大额券！国内唯一，南航这条洲际航线即将开航，美酒，考拉，蓝花楹，绝美海岸线....大美南澳超出你的想象！

6 天前

隆众资讯订阅号 · 能化行业拟在建项目统计周报（2024.06.17-06.23）

5 月前

解螺旋医药资讯 · 市三甲合同制与县医院编制，建议你这样选！

3 月前

AI工具派 · AI 神器太牛逼了！

2 月前

关于移动版 · Py中国 · RSS之家 · CodingPro · Code · Link之家 · 卧龙AI搜索 · 小百科

今天看啥 - 微信公众号rss订阅, 微信rss, 稳定的RSS源

© 2024 ~ 沪ICP备11025650号