2.1 Unet
如图1所示,基础Unet架构共5层,蓝色箭头代表卷积,红色箭头代表下采样,绿色箭头代表上采样,灰色箭头表示对某一层特征图复制并裁剪成需要的大小。整体网络呈对称结构,即Encoder-Decoder结构,左边称为收缩路径,亦称为编码阶段,通过卷积神经网络以提取图片的抽象特征信息;右边称为扩张路径,亦称为解码阶段,通过双线性插值算法还原抽象特征的图像尺寸。左边参考VGG16 建立,采用典型的卷积神经网络结构,共有4次下采样和5组卷积,输入数据大小为572×572×1,每组卷积都由两次卷积操作组成,卷积核大小为3×3,随后是一次卷积操作,采样核为2×2,步长为2。结果就是特征图尺寸不断缩小,特征图通道数不断增加,左侧最后输出数据大小为 28×28×1024。右侧先进行上采样,卷积核大小为 2×2,再和左侧收缩路径上相应层的特征图叠加,然后卷积。