2.1注意力机制
本文中采用了属于通道-空间类型的注意力机制CA(Coordinate Attention)[8],其赋予不同通道以及同一通道不同位置不同的注意力权重,让网络聚焦于局部信息,定位到场景中感兴趣区域,模块结构如图2-1。该模块包含两个阶段:坐标信息嵌入阶段和坐标注意力生成阶段。坐标信息嵌入阶段利用全局池化操作分别生成两个沿水平和垂直方向的一维特征向量;坐标注意力生成阶段对上一阶段生成的两个一维向量进行非线性变换,所得变换向量作为两个注意力权重,与输入特征图相乘来增强特征图的表示能力。
2.2空间空洞金字塔
空洞卷积[9]相较于正常卷积具有扩大网络感受野的作用,且多个不同扩张率的空洞卷积并联在一起可以捕获多尺度信息。获取空洞卷积的感受野,首先要计算与空洞卷积等效的标准卷积的核大小,如式2-1,而后计算空洞卷积的感受野大小,如式2-2和2-3。