注册
登录
专栏名称:
CV技术指南
长期更新:深度学习、计算机视觉相关技术的总结;图像处理相关知识;最新论文;经典论文;论文综述、tensorflow和pytorch等内容总结。涉及领域 :神经网络模型、transformer模型、目标检测、语义分割、目标跟踪、视频理解等。
我也要提交微信公众号
今天看啥
微信公众号rss订阅, 微信rss, 稳定的RSS源
微信公众号RSS订阅方法
B站投稿RSS订阅方法
雪球动态RSS订阅方法
微博RSS订阅方法
微博搜索关键词订阅方法
豆瓣日记 RSS订阅方法
目录
相关文章推荐
自贡网
·
素质教育能花钱“购买”吗
·
5 小时前
自贡网
·
小雪至 冬伊始
·
10 小时前
自贡网
·
扩散!自贡这一路段将分时段双向禁行
·
昨天
四川日报
·
百雀羚回应“网传护肤品添加禁用原料”
·
2 天前
今天看啥
›
专栏
›
CV技术指南
GPT-4遇见SAM2:免训练多模态分割的全新解决方案!
CV技术指南
·
公众号
· · 2024-09-10 14:30
文章预览
前言 免训练 多模态分割领域有了 新突破 ! Pytorch训练营,花两个星期彻底掌握代码实现 CV各大方向专栏与各个部署框架最全教程整理 CV全栈指导班、基础入门班、论文指导班 全面上线!! 来源: 量子位 仅用于学术分享,若侵权请联系删除 免训练 多模态分割领域有了 新突破 ! 中科院信工所、北航、合工大、美团等单位 联合提出了一种名为 AL-Ref-SAM 2 的方法。 这种方法利用 GPT-4和SAM-2来统一多模态分割 ,让系统在免训练的情况下,也能拥有不亚于全监督微调的性能! 论文:https://arxiv.org/pdf/2408.15876 代码:github.com/appletea233/AL-Ref-SAM2 ≥ 全监督方法 多模态分割主要有两种方法:一种是依据 文字描述 找到视频中特定对象的分割方法(RVOS),另一种是通过 声音识别 视频中发声对象的方法(AVS)。 免训练的多模态视频指代分割虽然在数据和训练成 ………………………………
原文地址:
访问原文地址
快照地址:
访问文章快照
总结与预览地址:
访问总结与预览
分享到微博
推荐文章
自贡网
·
素质教育能花钱“购买”吗
5 小时前
自贡网
·
小雪至 冬伊始
10 小时前
自贡网
·
扩散!自贡这一路段将分时段双向禁行
昨天
四川日报
·
百雀羚回应“网传护肤品添加禁用原料”
2 天前
雪球
·
在成熟赛道mmo和放置上,心动没有失手并且做出大爆款。在暗黑打宝-20240706081837
4 月前
丁香园
·
靠「文献计量学」发了篇 12.5 分综述,比做 Meta 还简单!
3 月前
抗体圈
·
双抗ADC癌症1类新药获批临床,普方生物申报!
2 月前
纳米医学进展
·
浙江大学附属第二医院眼科中心周民研究团队《ACS Nano》:基于锰增强细菌性铜中毒样死亡治疗细菌性肺炎的粘液渗透性局部递送策略
1 周前