一个决策树所能提供的特征往往是有限的,限制了模型的性能,所以就会需要随机森林,RF全称 random forest也就是随机森林,随机森林是由多个决策树随机生成的森林,决策树的每一个节点都是特征的一个子集,用于计算输出。随机森林将单个决策树的输出整合起来生成最后的输出结果,同一个数据从不同的决策树测试会有不同的测试结果 SVM比较更适合于处理小样本下的机器学习问题,因为当样本量比较多的时候,他的处理速度不是很好。SVM可以支持解决高维问题;另外他的决策结果受到某部分特定支持的向量影响,无需特别依赖整个数据,不会因为某些局部极值而影响 RF实现比较方便简单,同时也有强大的处理性能,能够处理高维问题,同时由于他支持随机抽取特征所以并不要特别选取特征,另外在训练完成后,能够给出那些feature比较重要,模型泛化能力强,对于不平衡的数据集来说,它可以平衡误差;如果有很大一部分的特征遗失,仍可以维持准确度。