文章预览
神经网络在计算机视觉领域取得了重大进展,比如自动驾驶和人脸识别等ai技术! 但是大多数人所熟知的常规全连接神经网络并不适合许多现实生活中的图像识别任务。 它在著名的MNIST数据集上能发挥作用,但该数据集仅包含28×28像素的小图像。 高清(HD)图像的像素为1280×720,即大约100万像素,这意味着输入层将需要100万个神经元。 更不用说隐藏层所需的数百万个权重了,由于维度复杂性过高,常规神经网络并不适用。 那么,我们该怎么办呢?答案当然是卷积神经网络(CNN)! 卷积神经网络是当今大多数计算机视觉任务的金标准,它们采用部分连接的层并共享权重,从而降低了模型的复杂性,而不是使用全连接层。 例如,对于全连接神经网络层中的每个神经元,如果图像为100×100像素,我们将需要10,000个权重。 然而,CNN可能只需要25个神经元
………………………………