专栏名称: arXiv每日学术速递
跟踪计算机视觉、人工智能、机器学习、NLP、语音识别、量化金融等热门方向学术信息
今天看啥  ›  专栏  ›  arXiv每日学术速递

LoFormer,局部频率 Transformer助 力图像去模糊,平衡全局建模与细粒度相关性 !

arXiv每日学术速递  · 公众号  ·  · 2024-08-02 12:24

文章预览

由于自注意力(SA)的计算复杂性,图像去模糊的常见技术往往要么采用局部SA,要么使用粗粒度全局SA方法,但这两种方法都存在一些缺点,比如牺牲全局建模能力或缺乏细粒度相关性。 为了解决这个问题,同时有效地建模长距离依赖关系而不牺牲细粒度细节,作者提出了一种新颖的方法,称为局部频率 Transformer (LoFormer)。 在LoFormer的每个单元中,作者在频域(Freq-LC)中引入了局部通道自注意力机制,以同时捕获低频和高频局部窗口内的交叉协方差。 这些操作具有以下优点:(1)确保了粗粒度结构和细粒度细节具有平等的学习机会,(2)与粗粒度全局SA方法相比,探索了更广泛的表示性属性。此外,作者提出了一种与Freq-LC互补的MLP门控机制,该机制旨在过滤掉不相关的特征,同时增强全局学习能力。 作者的实验表明,LoFormer在图像去模糊任务中显 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览