GPT-4结合SAM 2：免训练多模态分割的全新解决方案！

机器学习实验室 · 公众号 · · 2024-09-09 16:51

文章预览

转自：量子位作者：北京航空航天大学李红羽免训练多模态分割领域有了新突破！中科院信工所、北航、合工大、美团等单位联合提出了一种名为 AL-Ref-SAM 2 的方法。这种方法利用 GPT-4和SAM-2来统一多模态分割，让系统在免训练的情况下，也能拥有不亚于全监督微调的性能！ ≥ 全监督方法多模态分割主要有两种方法：一种是依据文字描述找到视频中特定对象的分割方法（RVOS），另一种是通过声音识别视频中发声对象的方法（AVS）。免训练的多模态视频指代分割虽然在数据和训练成本上有较大优势，却由于缺乏在特定任务数据上针对性的模型参数调整，导致性能与全监督方法有较大差距。而研究团队要解决的就是这个问题。实验中，他们对多个RVOS基准数据集进行了广泛验证，包括Ref-YouTube-VOS、Ref-DAVIS17和MeViS，同时在AVSBench的多个子集 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博