🌟欢迎来到 我的博客 —— 探索技术的无限可能!
🌟博客的简介(文章目录)
目录
- 背景描述
- 数据说明
- 数据来源
- 决策树的介绍和应用
- 决策树的介绍
- 决策树的优点
- 决策树的缺点
- 决策树的应用
- 实战
- 演示
- 导入模块
- 训练模型
- 数据和模型可视化(需要用到graphviz可视化库)
- 模型预测
- 基于penguins_raw数据集的决策树实战
背景描述
本次我们选择企鹅数据(palmerpenguins)进行方法的尝试训练,该数据集一共包含8个变量,其中7个特征变量,1个目标分类变量。共有150个样本,目标变量为 企鹅的类别 其都属于企鹅类的三个亚属,分别是(Adélie, Chinstrap and Gentoo)。包含的三种种企鹅的七个特征,分别是所在岛屿,嘴巴长度,嘴巴深度,脚蹼长度,身体体积,性别以及年龄。
数据说明
变量 | 描述 |
---|---|
species | a factor denoting penguin species |
island | a factor denoting island in Palmer Archipelago, Antarctica |
bill_length_mm | a number den |