问小白 wenxiaobai
资讯
历史
科技
环境与自然
成长
游戏
财经
文学与艺术
美食
健康
家居
文化
情感
汽车
三农
军事
旅行
运动
教育
生活
星座命理

卷积神经网络(CNN)的特征提取原理与结构详解

创作时间:
作者:
@小白创作中心

卷积神经网络(CNN)的特征提取原理与结构详解

引用
51CTO
1.
https://blog.51cto.com/u_16099199/13006246

卷积神经网络(CNN)是当前语音分析和图像识别领域的研究热点。它通过独特的网络结构和特征提取方法,在保持生物神经网络相似性的同时,降低了模型复杂度,减少了权值数量。本文将详细介绍CNN的基本概念、网络结构以及其在图像处理中的应用。

卷积神经网络的基本概念

卷积神经网络是一种人工神经网络,其独特的权值共享网络结构使其更接近生物神经网络。这种结构降低了模型的复杂度,减少了需要训练的参数数量,特别是在处理多维图像时优势明显。CNN能够直接处理图像数据,避免了传统算法中复杂的特征提取和数据重建过程。

CNN的设计初衷是为了识别二维形状,其网络结构对图像的平移、比例缩放、倾斜等变形具有高度不变性。作为深度学习架构,CNN旨在减少数据预处理的需求,通过层级结构自动提取图像的显著特征。

卷积神经网络的网络结构

卷积神经网络由多个二维平面组成,每个平面包含多个独立神经元。其基本结构包括特征提取层(C层)和特征映射层(S层)。


图:卷积神经网络的概念示范

  • C层(特征提取层):每个神经元的输入与前一层的局部感受野相连,用于提取局部特征。一旦特征被提取,它们之间的位置关系也随之确定。
  • S层(特征映射层):由多个特征映射组成,每个特征映射是一个平面,平面上所有神经元的权值相等。特征映射采用影响函数核小的sigmoid函数,以获得位移不变性。

此外,由于特征映射层的权值共享机制,大大减少了网络的自由参数数量,降低了训练复杂度。每层特征提取后,都会通过求局部平均和二次提取的方式进一步处理,这种两次特征提取的结构增强了网络对输入样本畸变的容忍能力。

降低参数数量的两种方法

局部感知野

人对外界的认知是从局部到全局的,图像的空间联系也是局部的像素联系较为紧密。因此,每个神经元只需要对局部区域进行感知,然后在更高层将局部信息综合起来得到全局信息。


图:局部感知野示意图

例如,对于1000x1000像素的图像,如果每个隐层神经元都连接所有像素点,将产生10^12个连接。而通过局部感知野机制,每个神经元只需连接10x10的局部区域,连接数减少到10^8,大大降低了训练难度。

参数共享

参数共享基于图像各部分统计特性一致的原理,意味着在某一部分学习到的特征可以应用于其他部分。每个神经元使用相同的卷积核进行卷积,大大减少了参数数量。


图:参数共享示意图

假设使用100种不同滤波器,每种滤波器有100个参数,总共需要10K个参数。每种滤波器生成一个特征映射(Feature Map),100种滤波器生成100个特征映射,这些特征映射组成一层神经元。

总结

卷积神经网络通过局部感知野和参数共享机制,有效降低了模型复杂度,提高了训练效率。其独特的网络结构使其在图像识别和处理领域展现出强大的能力,是当前深度学习研究的重要方向之一。

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号