2.2.1 大感受野的FDDM与TDDM设计
为在频率方向和时间方向均获得较大的感受野,本文分别设计了频率扩张密集模块 (Frequency Dilated Dense Module, FDDM) 和时间扩张密集模块 (Time Dilated Dense Module, TDDM)。
由个FDCU卷积单元密集连接而成,每个FDCU都由两部分组成,每一部分都包括归一化层 (Batch Normalization, BN)、修正线性单元 (Rectified Linear Unit, ReLU) 和2-D卷积层3层网络层。第1部分使用的是普通2-D卷积,用以减少通道数,第2部分使用的是频率扩张2-D卷积,用以在大感受野下捕获到频率方向的依赖关系,并在输出恢复整个FDCU的固定通道数为16。
图1的FDDM结构特色在于引入了密集连接:表现为每一级FDCU的输入都是整个FDDM的输入与其前面各级FDCU输出的汇集,从而各级FDCU的输入依次为。为保证在频率方向获得足够大的感受野,需逐级增大FDCU的扩张因子,将其依次设定为。