通过数据集可以创建树,但是字典的表示形式非常不易于理解,而且直接绘制图形也比较困难。但是通过Matplotlib库可以绘制树形图。
决策树的主要优点就是直观、易于理解,如果不能将其直观的显示出来,就无法发挥其优势。
Matplotlib提供了一个非常有用的注解工具annotations,它可以在数据图形上添加文本注解,注解通常用于解释数据的内容。由于数据上面直接存在文本描述非常丑陋,因此工具内嵌支持带箭头的划线工具,使我们可以在其他恰当的地方指向数据位置,并在此处添加描述信息,解释数据内容。
def plotNode(nodeTxt,centerPt,parentPt,nodeType):createPlot.axl.annotate(nodeTxt,xy=parentPt,xycoords='axes fraction',xytext=centerPt,textcoords='axes fraction',va='center',ha='center',bbox=nodeType,arrowprops=arrow_args)
def createPlot():fig=plt.figure(1,facecolor='white')fig.clf()createPlot.axl=plt.subplot(111,frameon=False)plotNode('决策节点',(0.5,0.1),(0.1,0.5),decisionNode)plotNode('叶结点',(0.8,0.1),(0.3,0.8),leafNode)plt.show()
这是第一版的createPlot()函数,代码定义了描述树节点格式的常量。然后定义plotNode()函数执行了实际的绘图功能,该函数需要一个绘图区,该区域由全局变量createPlot.axl定义。最后定义createPlot()函数,它是这段代码的核心。createPlot()函数首先创建了一个新图形并清空绘图区,然后在绘图区上绘制两个代表不同类型的树节点,后面将用这两个节点绘制树形图。
createPlot()