1.1二叉树支持向量机多类分类
二叉树支持向量机多类分类算法(BT-SVM)是将所有的类分为二个类别,再将子类进 一步划分成二个子类,一直循环下去,直到所有的节点都只包含一个单独的类别为止,然后在每个非叶子节点处训练一个二值SVM分类器,当二叉树的结构接近正态二叉树时,其分类精度和训练速度都将是最好的[7]。
在多分类问题中,BT-SVM 分类算法不仅可以有效克服不可分问题,对于 k 类问题,BT-SVM只需要构造k-1个二值分类器,这样的二叉树结构是不能够确定的,因为对同一个多类分类问题会得到不同的分类模型,图1给显示的是两种二叉树结构。再则这种方法会出现错误累积的结果。就是在上层节点处分类如果有错误分类,错误就会传递下去,下一节点将不再分类,所以 BT-SVM最上层节点的子分类器对整个分类器的性能影响很大。因此就需要重新构造合理的二叉树结构,即构造最优的二叉分类树[8]。