专栏名称: 专知

专知，为人工智能从业者服务，提供专业可信的人工智能知识与技术服务，让认知协作更快更好！

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

相关文章推荐

天玑-无极领域 · 《哪吒之魔童降世》《哪吒之魔童闹海》核心思想 ... · 19 小时前

中产先生 · 什么情况？今年的春节消费，很多人发现一件怪事 · 昨天

洋县吧 · 马龙、樊振东、陈梦确定无缘参赛 · 3 天前

上游新闻 · 刘国梁最新表态！ · 4 天前

文明贵州 · “年味”年俗丨正月初五 · 5 天前

今天看啥 › 专栏 › 专知

视觉如何模型统一？牛津大学Shuyang Sun博士论文《迈向统一视觉感知》全面阐述

专知 · 公众号 · · 2024-08-12 14:00

文章预览

来自牛津大学 Shuyang (Kevin) Sun博士论文《Towards Unified Visual Perception 》值得关注！探讨统一视觉感知系统的构建。 Shuyang (Kevin) Sun 牛津大学Torr视觉组的DPhil（博士）学生，导师为Philip Torr教授和Victor Prisacariu教授。曾在悉尼大学SIGMA实验室攻读硕士学位，师从Ouyang Wanli教授。有幸与谷歌研究院的Weijun Wang和Liang-Chieh Chen，Intel ISL的Vladlen Koltun、Philipp Krähenbühl和René Ranftl紧密合作。于2016年在中国武汉大学获得软件工程学士学位。目前，他的研究重点是构建具有统一感知的综合视觉系统。 https://kevin-ssy.github.io/ 本论文通过利用视觉Transformer（Vision Transformers, ViTs）的能力，探索计算机视觉中视觉感知的前沿领域，旨在创建一个统一的框架来应对跨任务和跨粒度的挑战。我们从人类视觉系统在不同细节层次处理视觉信息的能力以及Transformer在自然语言处理（NLP ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

天玑-无极领域 · 《哪吒之魔童降世》《哪吒之魔童闹海》核心思想是反抗精神。“我命由-20250206185842

19 小时前

中产先生 · 什么情况？今年的春节消费，很多人发现一件怪事

昨天

洋县吧 · 马龙、樊振东、陈梦确定无缘参赛

3 天前

洋县吧 · 马龙、樊振东、陈梦确定无缘参赛

3 天前

上游新闻 · 刘国梁最新表态！

4 天前

上游新闻 · 刘国梁最新表态！

4 天前

文明贵州 · “年味”年俗丨正月初五

5 天前

文明贵州 · “年味”年俗丨正月初五

5 天前

民银研究 · 【民银研究】图说经济金融（第66期）

8 月前