文章预览
↑ 点击 蓝字 关注极市平台 作者丨VincentLee 来源丨晓飞的算法工程笔记 编辑丨极市平台 极市导读 本文提出了一种无需额外数据和训练即可识别未知类别的语义分割方法,通过结合视觉-语言模型和新的评分函数来提高对离群样本的检测能力。 >> 加入极市CV技术交流群,走在计算机视觉的最前沿 论文地址: https://arxiv.org/abs/2409.17330 创新性 提出VL4AD模型用于解决语义分割网络难以检测来自未知语义类别的异常的问题,避免额外的数据收集和模型训练。 VL4AD将视觉-语言(VL)编码器纳入现有的异常检测器,利用语义广泛的VL预训练来增强对离群样本的感知,还加入max-logit提示集成和类别合并策略用于丰富类别描述。 提出了一种新的评分函数,可通过文本提示实现无数据和无训练的离群样本监督。 VL4AD 视觉文本编码器 视觉编码器 是与文本编码器
………………………………