专栏名称: 自动驾驶之星
自动驾驶之星,是一个以自动驾驶量产交流为主的社区。这里有自动驾驶量产第一线的前沿动态,有一群奋斗在自动驾驶量产第一线的小伙伴在分享他们的量产经历。期待你的加入!希望每个人在这个浪潮中都能成为自动驾驶之星!
今天看啥  ›  专栏  ›  自动驾驶之星

T-Rex2--视觉与文本融合提示,超强跨图目标检测

自动驾驶之星  · 公众号  ·  · 2024-06-20 07:00
    

文章预览

点击下方 卡片 ,关注“ 自动驾驶之星 ” 这里有一群奋斗在自动驾驶 & 座舱量产第一线的小伙伴等你加入 写在前面的话:   今天给大家带来一种不一样的目标检测方案,T-Rex2视觉与文本融合提示,超强跨图目标检测, 由 IDEA研究院发布。 1.  T-Rex2 玩法 给模型一组视觉 prompt ,模型就可以把你想要标记出来的目标框出来。如下图左侧为我们给出的视觉 prompt ,即一个 bbox ,右边为模型输出的检测结果   https://deepdataspace.com/playground/ivp 不开源,很气 2.视觉 prompt 与文本 prompt 2.1 视觉 prompt 的优势 在实际工业应用中, 常见的需求 是在 ⼀张或多张图像上进行视觉提示,然后在其他图像上使用这个视觉提示进行检测 ,这便是 跨图检测 能力。这一关键能力,让目标检测技术在生产生活中可以真正开始广泛应用。如工业生产流水线器件检测,交通航运领域的 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览