基于多特征融合的鸟类物种识别方法
摘 要:深度学习在鸟类物种识别中得到了广泛的应用,输入特征的选择直接影响深度学习分类性能,为了进一步提高基于深度学习的鸟类物种识别模型的分类性能, 本文提出一种多特征融合识别方法。该方法首先通过短时傅里叶变换、梅尔倒谱变换和线性调频小波变换分别计算得到鸣声信号的3种语图样本集,然后分别利用3种语图样本集训练3个基于VGG16迁移的单一特征模型,最后将3个模型的输出进行加权求和实现融合,对语图进行分类,实现鸟类物种的识别。以ICML4B鸣声库的35种鸟类为研究对象,采用持续时间为500ms的语图作为输入,修正了加权交叉熵函数以克服样本不平衡的问题,对比了4种模型的平均识别准确率(MAP),结果表明特征融合模型较单一特征模型的MAP大大提升,最大提高了0.307;选择输入语图的持续时间分别为100ms、300ms以及500ms,对比不同持续时间下4种模型的测试MAP值,结果表明,持续时间为300ms时4种模型的MAP值均为最高。说明通过选择合适的语图持续时间,本文提出的特征融合模型可以有效提高鸟类物种识别准确率。
关键词:鸟类物种识别;深度卷积神经网络; 多特征融合