EVA 与 CLIP 的融合力量 | 在 V3Det 数据集上展现强大的语义特征提取能力！

集智书童 · 公众号 · · 2024-06-20 09:00

文章预览

点击下方卡片，关注「集智书童」公众号点击加入👉 「集智书童」交流群在本技术报告中，作者展示了在Vast Vocabulary Visual Detection（V3Det）数据集上针对监督大词汇视觉检测任务的研究成果。如何处理复杂类别和检测框已成为这一赛道的难点。原始的监督检测器不适用于此任务。作者设计了一系列改进措施，包括调整网络结构、改变损失函数以及设计训练策略。作者的模型在 Baseline 基础上有所提升，并在2024年V3Det挑战的大词汇目标检测（监督）赛道和开放词汇目标检测（OVD）赛道的排行榜上取得了优异的成绩。 1 Introduction V3Det数据集[38]是一个大规模、丰富标注的数据集，包含超过13,000个目标类别的检测边界框标注，这些标注是基于真实图像的。它包括一个分层的类别结构，详细的类别隶属关系形成一个完整的关系树。如图1所示，V3Det包含245 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

阿里云开发者 · 分布式读写锁的奥义：上古世代 ZooKeeper 的进击

昨天

质安选 · 【一起食安行×纽勤】微生物标准与检验技术交流会暨纽勤Petrifilm测试片上市40周年年庆——郑州专场开始报名啦~

5 天前

质安选 · 工厂新风系统基本知识与风险管控

5 天前

阿里云开发者 · 为什么大模型连"Strawberry"的"r"都数不对？

5 天前

英特尔中国 · 《七日世界》公测火热开启，英特尔锐炫显卡提供Day 0支持

4 月前

荣德基教辅 · 暑假免费！中小学内部《新概念英语》学习群免费开放！仅限200人！

4 月前

星河投资日记 · 2024年8月16日市场交易数据及全球市场动态

3 月前

EVA 与 CLIP 的融合力量 | 在 V3Det 数据集上展现强大的语义特征提取能力 ！

文章预览

EVA 与 CLIP 的融合力量 | 在 V3Det 数据集上展现强大的语义特征提取能力！