文章预览
近期在大规模基础模型上的进展引发了对训练高效大型视觉模型的广泛关注。一个普遍的共识是必须聚合大量高质量的带注释数据。然而,鉴于计算机视觉中密集任务(如目标检测和分割)标注的固有挑战,实际的策略是结合并利用所有可用的数据进行训练。 论文提出了 Plain-Det ,提供了灵活性以适应新的数据集,具有跨多样数据集的稳健性能、训练效率和与各种检测架构的兼容性。结合 Def-DETR 和 Plain-Det ,在 COCO 上达到 51.9 的 mAP ,匹配当前最先进的检测器。在 13 个下游数据集上进行了广泛的实验, Plain-Det 展现了强大的泛化能力。 来源:晓飞的算法工程笔记 公众号,转载请注明出处 论文: Plain-Det: A Plain Multi-Dataset Object Detector 论文地址:https://arxiv.org/abs/2407.10083 论文代码:https://github.com/SooLab/Plain-Det Introduction 大规模数据集促进了计算机视觉的
………………………………