今天看啥  ›  专栏  ›  新机器视觉

一个小改动,CNN输入固定尺寸图像改为任意尺寸图像

新机器视觉  · 公众号  ·  · 2024-06-22 21:07
    

文章预览

本文小白将和大家一起学习如何在不使用计算量很大的滑动窗口的情况下对任意尺寸的图像进行图像分类。通过修改,将ResNet-18CNN框架需要224×224尺寸的图像输入改为任意尺寸的图像输入。 首先,我们澄清一个对卷积神经网络(CNN)的误解。 卷积神经网络不需要固定大小的输入 如果用过CNN对图像进行分类,我们需要对输入图像进行裁剪或调整大小使其满足CNN网络所需的输入大小。 虽然这种做法非常普遍,但是使用此方法存在一些局限。 1. 分 辨率下降 :如果在一幅大图中有一只小狗但其只占据图像中的一小部分,则调整图像的大小会使照片中的狗变得更小,以致无法正确分类图像。 2. 非正方形长宽比 :通常,图像分类网络是在正方形图像上训练的。如果输入图像不是正方形,一般来说我们会从中心取出正方形区域,或者使用不同的比例调整宽 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览