1.1 RFBNet网络框架
RFBNet[7]是一种改进的SSD算法,保留了SSD网路优点,如利用不同比例的默认框获取不同尺度的目标、多尺度特征图目标检测等,RFBNet最大的改进之处是在SSD网络中引入了RFB模块,即:将原SSD网络中的卷积层fc6、Conv7改为RFB模块,并在Conv4_3和Conv7层后分别接RFB-s和RFB结构。
1.2 RFB模块
RFB模块启发于人类视觉感知系统,由多个具有不同感受野的卷积核结合而成,不仅能扩大有效感受野,还能加强感受野中心的特征信息。RFB模块结构主要由多分支卷积层和空洞卷积组成
1)多分支卷积层。为了获取更好的特征表示,RFB模块使用不同尺寸的卷积核,并以 inception的连接方式构成一个多分支网络。RFB模块分别采用了1x1、3x3、5x5的卷积核,此外,为了防止网络层数过深而引起的梯度消失的问题,RFB模块还使用了残差网络中短接的连接方式。RFB-s模块在RFB的基础上采用3x3的卷积核代替5x5的卷积核,并采用小卷积核串联的方式来代替大卷积核,如使用1x3和3x1的卷积核来代替一个3x3的卷积核,该操作不仅扩大了感受野,同时减少了参数量。