专栏名称: 极市平台

极市平台是由深圳极视角推出的专业的视觉算法开发与分发平台，为视觉开发者提供多领域实景训练数据库等开发工具和规模化销售渠道。本公众号将会分享视觉相关的技术资讯，行业动态，在线分享信息，线下活动等。网站: http://cvmart.net/

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

AAAI 2024 Oral｜打破边界：利用CLIP的多任务多模态视频行为识别方法

极市平台 · 公众号 · · 2024-07-09 22:00

文章预览

↑ 点击蓝字关注极市平台作者丨王蒙蒙@知乎（已授权）来源丨https://zhuanlan.zhihu.com/p/704566210 编辑丨极市平台极市导读本文提出了一种新颖的多模态、多任务适配框架，将强大的CLIP模型转移到视频动作识别任务中。该方法在确保最先进的零样本可转移性的同时，实现了强大的监督性能。 >> 加入极市CV技术交流群，走在计算机视觉的最前沿本文介绍我们在视频行为理解领域的一篇新工作，该工作发表在AAAI 2024（ Oral ）《A Multimodal, Multi-Task Adapting Framework for Video Action Recognition》。论文链接： https://ojs.aaai.org/index.php/AAAI/article/download/28361/28707 代码地址： https://github.com/sallymmx/m2clip 1 引言近年来，大规模视觉-语言预训练模型（VLM）如CLIP、ALIGN和Florence的出现引起了极大的关注。因此，研究人员积极探索有效地将这些大型模型适应于特定领域的 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博