1.1 LeNet-5卷积神经网络
计算机科学家LeCun等人开发的LeNet-5网络[14]是经典的2D卷积神经网络模型,已成功应用于阿尔茨海默氏病识别、交通标志识别、面部表情识别、气体识别、行人检测等领域。LetNet-5卷积神经网络最初是为了解决手写字体识别而设计的。作为是第一个成功实现数字识别问题的卷积神经网络,LeNet-5网络被誉为卷积神经网络的“Hello Word”。在 MNIST 数字识别数据集上,LeNet-5 网络可以取得高达 99.2%的正确率。
表1展示了传统的LeNet-5卷积神经网络的结构。由表格内容可以看出:LetNet-5卷积神经网络的输入层是大小为3232像素的手写字体图片。第一卷积层使用6个尺寸为55、滑动步长为1的卷积核对输入图像进行第一次卷积操作。第一池化层以尺寸为22进行下采样。第二卷积层使用16个尺寸为55、滑动步长为1的卷积核对特征图进行第二次卷积操作。第二池化层以2x2为单位下采样。最后是两个全连接层和输出层。