主要观点总结
本文介绍了深度学习在图像领域的应用,特别是深度卷积神经网络的发展。文章主要介绍了五种代表性的CNN结构,包括LeNet、Alex Net、VGG、Goog Le Net和Res Net,并详细阐述了它们的设计思想、网络结构、特点以及改进优点。这些网络结构在图像分类、定位等问题上取得了很好的成绩,但也存在一些不足。
关键观点总结
关键观点1: 文章概述了深度卷积神经网络的发展历程和重要性。
文章首先介绍了深度学习在图像领域的应用,以及深度卷积神经网络的发展历程。然后重点介绍了五种代表性的CNN结构的设计思想、网络结构、特点以及改进优点。
关键观点2: 文章详细描述了五种CNN结构的特点和改进。
文章分别详细描述了LeNet、Alex Net、VGG、Goog Le Net和Res Net这五种CNN结构的设计思想、网络结构、特点以及改进优点,包括使用非线性激活函数、增加网络深度、使用小尺寸卷积核、降低计算成本等。
关键观点3: 文章指出了这些网络结构在图像分类、定位等问题上的应用和取得的成果。
文章通过介绍这些网络结构在图像分类、定位等问题上的应用实例,展示了它们在解决实际问题上的有效性。
关键观点4: 文章也指出了这些网络结构存在的一些不足。
文章在介绍这些网络结构时,也指出了它们存在的一些不足,如计算量大、模型参数多、表征堵塞等问题。
文章预览
本文转载自人工智能感知信息处理算法研究院 深度学习是机器学习算法研究中新开辟的研究方向,在图像领域的应用是最开始的尝试。近年以来,计算机视觉领域和 CNN 网络结构的不断更新发展,出现了一批代表性的深度卷积神经网络。本章节主要介绍目标检测算法 YOLO 系列借鉴了设计思想的这些框架,分别是:Le Net、Alex Net、VGG、Goog Le Net和 Res Net。表 1 所示,介绍了代表性的 CNN 结构基本情况。 1 LeNet LeNet 卷积神经网络是由深度学习三巨头之一的 Yan Le Cun于 1994 年提出来的。其对构建的 MNIST手写字符数据集进行分类。LeNet 的提出确立了 CNN 的基本网络架构。如下图所示,Le Net 通过输入32 ×32 字符矩阵经过卷积层、下采样层、全连接层进行图像的分类识别。但因为当时硬件技术的局限性和训练数据的不丰富性,Le Net 模型的运
………………………………