CART 算法【python,机器学习,算法】

CART(Classification and Regression Tree)分类回归树。使用基尼指数计算得到树的节点。基尼指数表示系统整体的不确定性,
不确定性越大,基尼指数越大,所以在决策树中,将加权基尼系数最小的特征作为树的决策节点。

公式推导

  1. 基尼指数
    g i n i ( A ) = 1 − ∑ i ∈ ( y , n ) p i 2 gini(A)=1-\sum\limits_{i\in(y,n)}p_i^2 gini(A)=1i(y,n)pi2
    其中 p i p_i pi表示单分组中,yes或者no的比例(这里指的是样本中分类标签下的值,只有yesno两类)。
  2. 加权基尼指数
    w e i g h t _ g i n i = ∑ i = 1 k p i g i n i ( A ) i weight\_gini=\sum\limits_{i=1}^{k}p_i\ gini(A)_i weight_gini=i=1kpi gini(A)i,
    其中 p i p_i pi表示单分组占总样本的比例, g i n i ( A ) i gini(A)_i gini(A)i表示单分组的基尼指数。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/17402.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

28【Aseprite 作图】苹果——拆解

1 画苹果框架 左边:第一行 7 第二行 2 第三 四行1 竖着7行 竖着2行 竖着1 、1 行 横着2个 横着4个 苹果可以是左右对称的,完成上述后,水平翻转到右边 2 枝叶 第一行1 左边 2 3 4 行,各1 第5行,竖着4个 再横着3个 右边 竖着3个,然后斜着2个,然后斜着1个 最上面的,两个…

Java中的JSP与Servlet的详细解释

一、技术难点 在Java Web开发中,JSP(Java Server Pages)和Servlet是两个核心概念,它们各自有其技术难点。 JSP技术难点: JSP页面的生命周期管理:JSP页面在首次被访问时会被转换为Servlet,然后…

AI大模型下的微服务会有什么?

在人工智能领域,会使用到许多微服务来处理不同的任务。"微服务"指的是将一个大型应用拆分成一系列小的服务,每个服务运行在其独立的进程中,并通过轻量级的机制(通常是HTTP RESTful API)与其他服务通信。每个…

靶机Moonraker_1练习报告

Moonraker: 1靶机练习实践报告 一、安装靶机 靶机是.ova文件,需要用VirtualBox打开,但我习惯于使用VMWare,因此修改靶机文件,使其适用于VMWare打开。 解压ova文件,得到.ovf文件和.vmdk文件。 直接用VMWare打开.ovf文件即可。 …

webserver服务器从零搭建到上线(七)|Channel通道类和Poller抽象类

TcpServer是我们整个编写服务器的入口,其中有一个很重要的类:EventLoop事件分发器。 其实我们就可以把EventLoop当做我们的epoll_wait,它主要管理类一个Poller类,我们看名字就可以知道,Poller类应该封装了Epoll本身&a…

【服务器报错】Pycharm运行服务器代码提示 can‘t open file “本地文件路径“

1. 问题 Pycharm连接远程服务器,代码已经同步,运行时候报错 #模拟报错 bash: line 0: cd: G:/python/hhh/Hi: No such file or directory /home/hhh/anaconda3/envs/hard/bin/python: cant open file G:/python/hhh/hi/hei.py: [Errno 2] No such file…

顶级域名、主域名、子域名

在互联网上,域名系统(DNS)用于将人类可读的域名(如www.example.com映射到服务器的IP地址 域名可以分为多个部分,通常包括主域名(PrimaryDomain)和子域名(Subdomain)。 顶级域名 是域名系统的最高级别,通常代表特定的组织类型或国家 .com、…

springMVC工作流程

大家好,这里是教授.F 1.浏览器会先发送请求url,前端控制器/中央控制器/分发器(也就是DispatcherServlet)进行获取。 2.此时前端控制器会调用HandlerMapping处理器映射器,然后返回处理器执行器链(HandlerExe…

Android Service 启动流程

在早些年学习Android的时候,对Service有过总结,但是主要是如何去使用,注意事项,startService和bindService的区别。 Android Service_public int onstartcommand(intent intent, int flags-CSDN博客 但是今天从源码来总结下fram…

论文笔记《基于深度学习模型的药物-靶标结合亲和力预测》

基于深度学习模型的药物-靶标结合亲和力预测 这是一篇二区的文章,算是一个综述,记录一下在阅读过程中遇到的问题。 文章目录 基于深度学习模型的药物-靶标结合亲和力预测前言一、蛋白质接触图谱二、为什么蛋白质图谱的准确性对DTA模型预测结果没有影响1…

使用Python类的构造函数和析构函数

1、问题背景 当使用Python类时,可以使用构造函数和析构函数来初始化和清理类实例。构造函数在创建类实例时自动调用,而析构函数在删除类实例时自动调用。 在上面的代码示例中,Person类具有一个构造函数__init__和一个析构函数__del__。构造…

【代码】自定义函数

你有没有听过 n! ? n!n(n-1)(n-2)21 你想不想有一个c函数 jc() 专门用来计算n!? 不好意思,没有!c函数库说。没有咱自己可以造呀! 哈喽大家好,我是学霸小羊,今天讲讲自定义函数。 自定义函数的定义格式…

网易面试:手撕定时器

概述: 本文使用STL容器-set以及Linux提供的timerfd来实现定时器组件 所谓定时器就是管理大量定时任务,使其能按照超时时间有序地被执行 需求分析: 1.数据结构的选择:存储定时任务 2.驱动方式:如何选择一个任务并执…

CSS,HTML,JS 以及Vue前端面试题八股文总结【看完你就变高手】

■ 符号说明 💘 主题 🌟 常见重要 🌛 需要有印象的 🆕 v3新特性 ■ 杂谈 🌛 SEO优化 合理的title、description、keywords:搜索对着三项的权重逐个减小,title值强调重点即可;descrip…

东软的第三个研发基地,为什么选择了武汉?

继沈阳、大连之后,东软集团在国内打造的第三个研发基地——武汉东软软件园,于2024年5月25日正式开园。 “占地面积158亩、建筑面积14万余平方米的武汉东软软件园,从开工到竣工仅仅用了18个月的时间。这样的建设速度,充分体现了武汉…

使用XMLHttpRequest对象进行网络请求的步骤

使用XMLHttpRequest对象进行网络请求的基本步骤如下: 1:创建XHR对象: const xhr new XMLHttpRequest();2:初始化请求: xhr.open(method, url, async);method: HTTP请求方法,如 GET, POST, PUT, DELETE 等。 url: 请求的目标URL地址。 async: 是否异步…

2.开发环境介绍

开发环境介绍三种:第一种是在线开发环境、第二种是Windows下的开发环境、第三种是Linux下的开发环境。 1.在线开发环境 2.Windows下的开发环境 用的比较多的是Devc,新手适合使用,上手快,简单,方便。 Devc使用&#x…

蓝桥杯练习系统(算法训练)ALGO-932 低阶行列式计算

资源限制 内存限制&#xff1a;64.0MB C/C时间限制&#xff1a;1.0s Java时间限制&#xff1a;3.0s Python时间限制&#xff1a;5.0s 问题描述 给出一个n阶行列式(1<n<9)&#xff0c;求出它的值。 输入格式 第一行给出两个正整数n,p&#xff1b;   接下来n行&…

Flutter 中的 SizedOverflowBox 小部件:全面指南

Flutter 中的 SizedOverflowBox 小部件&#xff1a;全面指南 在 Flutter 的布局世界中&#xff0c;SizedOverflowBox 是一个相对独特的小部件&#xff0c;它允许子组件溢出其父组件的界限&#xff0c;同时保持父组件的尺寸不变。这在某些特定的布局场景下非常有用&#xff0c;…

软件工程作业6

问题&#xff1a;如果你要开发一个中小学生学习数学的软件你应该找谁去做用户调研&#xff1f; 开发一个针对中小学生的数学学习软件时&#xff0c;进行有效的用户调研至关重要&#xff0c;这能确保产品贴合目标用户的需求和学习习惯。以下是一些适合参与用户调研的对象&#…