飞机记录的飞参数据通常有几十种,经过研究发现,影响阶段划分的只有其中的某几种,而大部分飞参数据与阶段划分无明显关联,称为冗余参数。如果把所有的飞行参数都用于构建决策树模型,则会使决策树有非常多的分叉,变得臃肿,甚至导致误判。因此在使用决策树和随机森林算法构建分类模型之前,需要对飞行参数进行约简。参数约简是粗糙集理论中的核心研究内容,其主要思想是在保持决策能力不变的前提下,去除冗余的参数,只保留核心属性参数,来提高效率[4]。
本文所使用的飞参数据包含高度、俯仰角、空速、磁航向角度、攻角、升降速度、发动机转速、机体轴向加速度、横滚角等42个特征参数。根据起飞、爬升、巡航、降落和着陆5个飞行阶段的特点,并结合决策树分类算法的特征,通过模糊粗糙集的参数约简算法提取的主要参数为:高度,俯仰角,空速,机体轴向加速度四个飞行参数作为特征参数。