随机森林算法
- 决策树与随机森林
- 随机森林
决策树与随机森林
随机森林可以看作一个决策树的集合,由n个子训练集得到的决策树组成。
决策树(Decision tree)是一种特殊的树结构,由一个决策图和可能的结果(例如成本和风险)组成,用来辅助决策。机器学习中,决策树是一个预测模型,树中每个节点表示某个对象,而每个分叉路径则代表某个可能的属性值,而每个叶节点则对应从根节点到该叶节点所经历的路径所表示的对象的值。决策树仅有单一输出,通常该算法用于解决分类问题。
随机森林
随机森林可以同时胜任分类和回归。其中分类任务是对离散值进行预测(比如将一景图像中的植被,建筑,水体等地物类型分类);回归任务是对连续值进行预测(比如根据已有的数据预测明天的气温是多少度,预测明天某基金的价格)。
训练集有m个样本,每次有放回地从训练集中取出 n 个训练样本,组成新的训练集(m > n),利用新的训练集,训练得到N个子模型,对于分类问题,采用投票的方法,得票最多子模型的分类类别为最终的类别;对于回归问题,采用简单的平均方法得到预测值。