2.2.单项预测模型的选择
预测模型种类繁多且各有优劣势,从统计学层面来看,可分为回归问题和分类问题两大类,而在机器学习层面,可分为线性模型、树型模型和神经网络模型,(1)线性模型可细分为线性回归和逻辑回归,二者易于理解,但具有“过拟合”、无法预测更复杂行为的弊端。(2)树型模型可细分为决策树、随机森林、梯度提升,具有结果精确、稳定且更易于解释,并可以映射非线性关系以求解问题的优势。(3)神经网络模型近年被广泛应用,预测效率较高,但是可解释性较差。所以,对选入组合模型的算法成为了影响组合模型预测精度的核心因素,除了最简单依靠预测误差进行对比的方法,Samuels和 Sekkel(2017)[8]提出基于模型置信集(Model Confidence Set,MCS)的裁剪方法,认为该方法具有更好的鲁棒性以及更大的预测性能提升空间。