专栏名称: 极市平台
极市平台是由深圳极视角推出的专业的视觉算法开发与分发平台,为视觉开发者提供多领域实景训练数据库等开发工具和规模化销售渠道。本公众号将会分享视觉相关的技术资讯,行业动态,在线分享信息,线下活动等。 网站: http://cvmart.net/
今天看啥  ›  专栏  ›  极市平台

ECCV 2024|谷歌提出LookupViT:全新通用视觉Transformer块

极市平台  · 公众号  ·  · 2024-11-04 22:00

文章预览

↑ 点击 蓝字  关注极市平台 作者丨晓飞的算法工程笔记 来源丨晓飞的算法工程笔记 编辑丨极市平台 极市导读   本文介绍了谷歌提出的LookupViT,这是一种新型的通用视觉Transformer块,它通过利用图像和视频中的信息稀疏性来降低ViT的推理成本,实现了在保持或提高准确性的同时显著减少计算量。LookupViT通过压缩视觉信息到有限数量的标记,并在这些压缩标记与原始高分辨率标记之间进行信息共享,展示了在多个视觉任务中的有效性,包括图像分类和视频理解。   >> 加入极市CV技术交流群,走在计算机视觉的最前沿 视觉Transformer( ViT )已成为众多工业级视觉解决方案的事实标准选择。但由于每一层都计算自注意力,这导致其推理成本对许多场景而言是不可接受的,因为自注意力在标记数量上具有平方的计算复杂度。另一方面,图像中的空间信息 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览