专栏名称: 极市平台
极市平台是由深圳极视角推出的专业的视觉算法开发与分发平台,为视觉开发者提供多领域实景训练数据库等开发工具和规模化销售渠道。本公众号将会分享视觉相关的技术资讯,行业动态,在线分享信息,线下活动等。 网站: http://cvmart.net/
今天看啥  ›  专栏  ›  极市平台

大模型助力分割,刷新10项SOTA!清华和美团提出HyperSeg:通用分割框架

极市平台  · 公众号  ·  · 2024-12-17 22:00
    

文章预览

↑ 点击 蓝字  关注极市平台 作者丨CVer 来源丨CVer 编辑丨极市平台 极市导读   首个基于视觉大语言模型(VLLM)的通用分割模型,能够处理像素级的图像和视频感知任务,并具备复杂的推理和对话能力。HyperSeg在多个分割任务中刷新了10项SOTA(State of the Art),展现了其在视觉-语言推理感知任务中的卓越性能。模型和代码已开源。  >> 加入极市CV技术交流群,走在计算机视觉的最前沿 近来,视觉大语言模型(VLLM)在多种视觉-语言理解任务中表现出色的推理和对话能力。然而,这些方法基于全局的视觉-语言对齐,限制了其在视觉感知任务中细节理解能力,如图像和视频域的像素级分割。近期的研究使VLLM能够进行细粒度的视觉理解,如指代分割(RES)和推理分割(ReasoningSeg)。尽管这些方法的表现令人瞩目,目前仍缺乏基于VLLM的通用分割框架,可以 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览