应用决策树批量化自动生成【效果好】【非过拟合】的策略集

决策树在很多公司都实际运用于风险控制,之前阐述了决策树-ID3算法和C4.5算法、CART决策树原理(分类树与回归树)、Python中应用决策树算法预测客户等级和Python中调用sklearn决策树。

本文介绍应用决策树批量自动生成效果好,非过拟合的策略集。

文章目录

    • 一、什么是决策树
    • 二、决策树中专有名词理解
    • 三、应用决策树算法生成规则集
      • 1 导入数据
      • 2 看下数据基本情况
        • 2.1 用head函数看下数据表头和前几行数据
        • 2.2 用value_counts函数观测因变量y的数据分布
      • 3 把数据集拆分成训练集和测试集
      • 4 定义从决策树生成规则集的函数
      • 5 训练决策树生成规则集
      • 6 生成规则集数据框
      • 7 生成可视化决策树
      • 8 合并训练集和测试集规则数据
      • 9 筛选效果好的规则

  

一、什么是决策树

  
决策树:通过对已知样本的学习,一步一步将特征进行分类,从而将整个特征空间进行划分,进而区分出不同类别的算法。我们在逻辑判断中用到的思想if, else if ,else, then,其实就是决策树的思想。

  
  

二、决策树中专有名词理解

  
1.根节点:包含数据集中所有数据集合的节点,即初始分裂节点。
  
2.叶节点/终端节点:最终的决策结果(该节点不再进行划分),被包含在该叶节点的数据属于该类别。
  
3.内部节点:非根节点和叶节点的节点,该节点包含数据集中从根节点到该节点所有条件的数据集合。根据内部节点的判断条件结果,其对应的数据集合被分到两个或多个子节点中。
  
4.父节点:划分出子节点的节点。
  
5.子节点:由父节点根据某一规则分裂而来的节点。
  
6.节点的深度:节点与决策树根节点的距离,如根节点的子节点的深度为1.
  
7.决策树的深度:所有叶子节点的最大深度。
  
借用CART决策树原理(分类树与回归树)中的简单决策树说明以上名词,用图形展示如下:

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/37008.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

数字化那点事:一文读懂数字乡村

一、数字乡村的定义 数字乡村是指利用信息技术和数字化手段,推动乡村社会经济发展和治理模式变革,提升乡村治理能力和公共服务水平,实现乡村全面振兴的一种新型发展模式。它包括农业生产的数字化、乡村治理的智能化、乡村生活的现代化等方面…

Elasticsearch的节点、集群和分片

Elasticsearch的节点、集群和分片 节点 什么是节点 ES是使用Java语言开发的。ES可以创建多个节点,一个节点就是一个ES实例,也就是一个Java线程。ES在生产环境中每个节点都是分布在不同的服务器上的,目的是达到集群的高可用多个节点构成一个…

Nginx系列-1 Nginx安装与使用

背景 最近对项目进行了Https改造,改造过程涉及Nginx技术,因此进行简单总结。 从本文开始将开启一个新的专题Nginx系列,用于收集Nginx相关的文章,内容将包括: Nginx系列—1 Nginx安装与使用Nginx系列—2 Nginx配置Ngi…

记一次小程序渗透

这次的小程序渗透刚好每一个漏洞都相当经典所以记录一下。 目录 前言 漏洞详情 未授权访问漏洞/ 敏感信息泄露(高危) 水平越权(高危) 会话重用(高危) 硬编码加密密钥泄露(中危&#xff0…

熟练掌握爬虫技术

一、Crawler、Requests反爬破解 1. HTTP协议与WEB开发 1. 什么是请求头请求体,响应头响应体 2. URL地址包括什么 3. get请求和post请求到底是什么 4. Content-Type是什么1.1 简介 HTTP协议是Hyper Text Transfer Protocol(超文本传输协议)…

整合 Mybatis Plus

什么是 MyBatis Plus? MyBatis Plus (简称 MP) 是一款持久层框架,说白话就是一款操作数据库的框架。它是一个 MyBatis 的增强工具,就像 iPhone手机一般都有个 plus 版本一样,它在 MyBatis 的基础上只做增强…

NOI大纲——普及组——编码

编码 ##ASCLL码 ASCII码(American Standard Code for Information Interchange,美国信息交换标准代码)是一种基于拉丁字母的字符编码方案,主要用于表示文本数据。ASCII码包含128个字符(0-127)&#xff0c…

2024最新boss直聘岗位数据爬虫,并进行可视化分析

前言 近年来,随着互联网的发展和就业市场的变化,数据科学与爬虫技术在招聘信息分析中的应用变得越来越重要。通过对招聘信息的爬取和可视化分析,我们可以更好地了解当前的就业市场动态、职位需求和薪资水平,从而为求职者和招聘企业提供有价值的数据支持。本文将介绍如何使…

python自动化办公之PyPDF2

用到的库:PyPDF2 实现效果:打开pdf文件,把每一页的内容读出来 代码: import PyPDF2 # 打开pdf文件 fileopen(friday.pdf,rb) # 创建pdf文件阅读器对象 readerPyPDF2.PdfReader(file) # 获取pdf文件的总页数 total_pageslen(rea…

Amazon Q——2023 re:Invent 大会的 AI 革新之星

引言 在2023年的 re:Invent 大会上,亚马逊云科技(亚马逊云科技)不仅展示了包括 Amazon Graviton3、Amazon SageMaker Studio Lab、Amazon Connect Wisdom、Amazon QuickSight Q 和 Amazon Private 5G 在内的多项创新产品,还发布了…

【python爬虫】豆瓣爬虫学习

文章目录 网页地址爬虫目标技术栈爬虫代码注意事项 Python爬虫学习:我们可以选择一个相对简单的网站进行数据抓取。这里以抓取“豆瓣电影Top250”的信息为例,这个网站提供了丰富的电影数据,包括电影名称、评分、导演、演员等信息。 网页地址…

AI大模型技术在音乐创造的应用前景

大模型技术在音乐创作领域具有广阔的应用前景,可以为音乐家、作曲家和音乐爱好者提供以下方面的帮助。北京木奇移动技术有限公司,专业的软件外包开发公司,欢迎交流合作。 音乐创作辅助:大模型可以帮助音乐家和作曲家生成旋律、和声…

Win脚本开机自启ALIst和RClone

转自个人博客:https://www.jjy2023.cn/2024/05/23/win%e8%84%9a%e6%9c%ac%e5%bc%80%e6%9c%ba%e8%87%aa%e5%90%afalist%e5%92%8crclone/ 在配置完alist和rclone之后,就只需要每次开机启动两者就行了,所以感觉使用AListHelper没有必要&#xff…

算法金 | 协方差、方差、标准差、协方差矩阵

大侠幸会,在下全网同名「算法金」 0 基础转 AI 上岸,多个算法赛 Top 「日更万日,让更多人享受智能乐趣」 抱个拳,送个礼 1. 方差 方差是统计学中用来度量一组数据分散程度的重要指标。它反映了数据点与其均值之间的偏离程度。在…

Flask无法Debug

问题描述 Flask Debug的时候,可能会无法进入断点。我使用的是pycharm CE版本。 解决方案 确保pycharm安装路径不带空格。(带空格路径导致debug程序启动报错)Gevent compatible,这个东西老的pycharm版本必须勾选它,新…

中霖教育靠谱吗?在职备考一建好通过吗?

中霖教育靠谱吗?在职备考一建好通过吗? 课程设置:报名后会进行测评,了解学员的知识掌握情况、时间安排和记忆思维特点等,制定更适合的学习计划。 课程以考试通过为目标,去繁化简,只讲有用的干货,帮助快…

Python的GIL

Python的GIL是什么?它对多线程编程有什么影响? GIL(全局解释器锁)是Python解释器中的一个机制,它是为了保证在任何时刻只有一个线程执行Python字节码。GIL的存在主要因为Python的内存管理和垃圾回收机制是线程不安全的…

使用Vite工具创建项目,并使用Vue Router步骤

步骤 1: 安装 Vite 首先,确保你的电脑上已经安装了Node.js和npm。然后,通过以下命令全局安装Vite(如果已经安装,请跳过此步骤): npm install -g create-vite步骤 2: 创建新的Vue项目 使用Vite创建一个新…

Python 学习之标准库(二)

Python标准库是指Python编程语言自带的一组模块和包,它们是Python语言的核心组成部分,为开发者提供了丰富的功能和工具,帮助快速实现各种功能需求。以下是对Python标准库的一些主要内容和模块的归纳: 1. 数学计算: a.…

Python驱动的智能客服系统构建实录

Python驱动的智能客服系统构建实录 作为技术领域的老将,今天我打算带大家深挖一个热门应用——智能客服系统,并且如何通过Python这门万能钥匙,结合前沿的深度学习技术,赋予其更为人性化、高效的沟通能力。同时,我们不…