对于一个决策树的决策面:
他其实是在任意两个特征基础上对于所有的点进行一个分类,并且展示出不同类别的之间的决策面,进而可以很清楚的看出在这两个特征上各个数据点种类的分布。
对于多输出的问题,在利用人的上半张脸来恢复下半张脸的例子中,其实本质上应该是个回归问题,输入是上半张脸的特征,输出是下半张脸的特征,由于像素值是个连续的多值,所以是个回归的多输出问题。
然后对于cpp_alpha和impurities,每个alpha是一个一定程度的惩戒因子,用于控制数的复杂度,随着alpha的增加,更多的树枝会被修剪进而降低树的复杂度。
而impurities表示整个树的不纯洁度,我们当然希望树的不纯度较小点,为了平衡这两者,所以我们可以绘制出impurities-alpha
我们可以选择随着alpha增加时,impurities增加较为缓慢的点,以此来平衡。