专栏名称: AIWalker
关注计算机视觉、图像处理、深度学习等领域的干货分享与前沿paper解读。AIWalker由具有多年算法研究与产品化落地经验的Happy运营,原创为主、同时会转载优秀解读文章。欢迎志同道合的小伙伴们加入一同学习进步。
今天看啥  ›  专栏  ›  AIWalker

Transformer 助力 U-Net,提升宽角图像深度估计性能 !

AIWalker  · 公众号  ·  · 2024-10-18 12:44

文章预览

关注 「 AIWalker 」 并 星标 从此AI不迷路 来源于 AI视界引擎 ,作者 AI 引擎 宽角鱼眼图像在机器人、安全以及移动性(如无人机、航空电子设备)等应用的感知任务中越来越常见。然而,当前模型常常要么忽略宽角图像中的畸变,要么不适用于执行像素级任务。 在本文中,作者提出了一种基于径向 Transformer 架构的编码器-解码器模型,该模型通过利用径向畸变剖面所定义的物理特性来适应宽角镜头的畸变。 与原始模型仅执行分类任务不同,作者引入了一种针对像素级任务设计的U-Net架构,名为DarSwin-Unet。 此外,作者提出了一种新颖的策略,在创建图像输入标记时最小化稀疏性。作者的方法提高了模型处理宽角鱼眼图像中像素级任务的能力,使其在现实应用中更为有效。与其他 Baseline 方法相比,DarSwin-Unet在不同数据集上均取得了最佳结果,在有限畸 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览