文章预览
随着深度学习的快速发展,基于卷积神经网络(CNN)的U形网络在医学图像分割方面取得了成功,并广泛应用于各种任务。然而,它们在捕捉全局特征方面的局限性,限制了它们在复杂分割任务上的性能。 视觉 Transformer (ViT)的出现有效地弥补了CNN的这一缺陷,并推动了基于ViT的U形网络在医学图像分割领域的应用。 然而,ViT的高计算需求使其不适合许多具有有限资源的医疗设备和移动平台,限制了其在资源受限的边缘设备上的部署。 为了解决这个问题,作者提出了Evit-UNet,这是一种高效的基于ViT的分割网络,它降低了计算复杂性,同时保持了准确性,使其成为资源受限的医疗设备的理想选择。 Evit-UNet是基于U形结构的,包括编码器、解码器、 Bottleneck 层和 Shortcut ,结合卷积操作和自注意力机制以优化效率。 实验结果表明,Evit-UNet在医学图像分割
………………………………