深度学习是基于人们对神经网络的深层次研究,通过多个低层特征来表现高层特征 [9]。相比于其他理论,它分析的数据特征更多,拟合的函数更复杂,其准确度也更高[10]。深度学习理论含有多个理论模型,包括CNN、RNN、DBN等。其中,CNN相比于其他理论模型更具优势,因为不仅可以降低了模型的复杂程度,而且其理论也相对更加成熟,所以它也是当前应用最为广泛的理论之一。
1.2 CNN特性
卷积神经网络理论(CNN)有三大特点:局部区域连接、权值共享和池化采样。局部区域连接是指相邻的神经元并不是都互相连接的,这是因为在学习过程中可能只有局部的特征因素是比较重要,因此在神经网络中的神经元只需要感知局部信息,然后传递到更高层次的神经元来汇总,从而得到全部的信息。是神经元全部连接和局部连接的对比示意图。CNN的另一特点是权值共享,是指在任何一个卷积核在局部感受到的信息特征在整个图片上是相同的,我们可以将相同的信息特征用到整张图的所有位置进行特征学习。CNN的第三大特点就是池化采样,主要是通过平均值、方均值保留等方法对数据进行降维。通过这种方法可以有效的减少模型的参数数量,降低特征分辨率和过拟合的风险。