随机森林是机器学习的一种方法,计算速度快[]。它是通过多个决策树构造而成,最终的输出结果是由多个决策树组合而成的结果,因此由于任何一个单个决策树的输出结果[]。
本研究在构造随机森林模型过程中使用ID3算法建立决策树,并对ID3算法进行改进,在特征选择时进行最大特征数的限定,通过调节最大特征数以及决策树的个数,观察两者对随机森林的预测结果的影响,寻找最优参数,构造随机森林,实现分类目的。
随机森林所谓随机。即指样本以及特征的随机选择,本研究将数据集进行划分,对训练集的279个样本进行又放回地随机抽取,对抽取出的K组样本进行训练。