文章预览
Segment Anything Model(SAM),由Meta AI研究团队推出的一种通用目标分割模型,迅速引起了广泛关注,并对学术界产生了重大影响。为了将其应用扩展到视频领域,Meta进一步开发了Segment Anything Model 2(SAM2),这是一个统一模型,能够进行视频和图像分割。 与前辈相比,SAM2在适用领域、分割准确度以及运行速度方面都有显著提升。然而,本报告显示,在没有提示的情况下,SAM2在自动模式下识别图像中不同目标的能力与SAM相比有所下降。 具体来说,作者通过一项具有挑战性的伪装目标检测任务来评估这种性能下降,希望激励研究行人对SAM模型家族进行更深入的探索。本文的结果可以在https://github.com/luckybird1994/SAMCOD获取。 1 Introduction 近年来,大型语言模型(LLM)[4, 30, 34]在自然语言处理(NLP)领域引发了一场革命。这些基础模型展现出了卓越的迁移能力
………………………………