注册
登录
专栏名称:
CV技术指南
长期更新:深度学习、计算机视觉相关技术的总结;图像处理相关知识;最新论文;经典论文;论文综述、tensorflow和pytorch等内容总结。涉及领域 :神经网络模型、transformer模型、目标检测、语义分割、目标跟踪、视频理解等。
我也要提交微信公众号
今天看啥
微信公众号rss订阅, 微信rss, 稳定的RSS源
微信公众号RSS订阅方法
B站投稿RSS订阅方法
微博RSS订阅方法
微博搜索关键词订阅方法
豆瓣日记 RSS订阅方法
目录
相关文章推荐
北京大学
·
张帆,亚军!
·
22 小时前
北京大学
·
张帆,亚军!
·
22 小时前
EETOP
·
什么是 MRDIMM ?
·
昨天
EETOP
·
《ESD与Latch-up: 高抗性与解决方案》
·
昨天
EETOP
·
英飞凌触摸感应产品与解决方案技术直播
·
昨天
今天看啥
›
专栏
›
CV技术指南
ACL 2024 | PlugIR:开源还不用微调,首尔大学提出即插即用的多轮对话图文检索
CV技术指南
·
公众号
· · 2024-08-26 22:05
文章预览
前言 即插即用的PlugIR通过LLM提问者和用户之间的对话逐步改进文本查询以进行图像检索,然后利用LLM将对话转换为检索模型更易理解的格式(一句话)。首先,通过重新构造对话形式上下文消除了在现有视觉对话数据上微调检索模型的必要性,从而使任意黑盒模型都可以使用。其次,构建了LLM问答者根据当前情境中检索候选图像的信息生成关于目标图像属性的非冗余问题,缓解了生成问题时出现的噪音和冗余性问题。此外,还新提出Best log Rank Integral(BRI)指标,用于衡量多轮任务中的综合性能。论文验证检索系统在各种环境下的有效性,并突出了其灵活的能力。 Pytorch训练营,花两个星期彻底掌握代码实现 CV各大方向专栏与各个部署框架最全教程整理 CV全栈指导班、基础入门班、论文指导班 全面上线!! 论文: Interactive Text-to-Image Retrieval with Large L ………………………………
原文地址:
访问原文地址
快照地址:
访问文章快照
总结与预览地址:
访问总结与预览
分享到微博
推荐文章
北京大学
·
张帆,亚军!
22 小时前
北京大学
·
张帆,亚军!
22 小时前
EETOP
·
什么是 MRDIMM ?
昨天
EETOP
·
《ESD与Latch-up: 高抗性与解决方案》
昨天
EETOP
·
英飞凌触摸感应产品与解决方案技术直播
昨天
灵活胖子的科研进步之路
·
MatchIt(2):介绍
5 月前
Open Islands
·
社区活动|开放群岛开源社区人工智能高质量数据集与数据资产化研讨会成功举办,共议人工智能与数据资产化发展新机遇
3 月前