模型评估指标(三)

模型评估指标三

    • 1、模型评估回顾
    • 2、综合分类模型评估指标
      • 2.1、F1-Score与Fβ-Score
      • 2.2、灵敏度与特异度
      • 2.3、ROC曲线
      • 2.4、AUC曲线
    • 3、分类模型评估指标总结
    • 4、Sklearn模型评估指标




1、模型评估回顾


本文接上篇:模型评估指标(二)

分类模型的评估与回归模型的侧重点不同,回归模型针对连续型的数据,而分类模型针对的是离散的数据

因此,分类模型的评估指标也与回归模型不同,回归模型的评估指标包括均方误差(MSE)、均方根误差(RMSE)和平均绝对误差(MAE)等,分类模型的评估指标通常包括准确率、精确率、召回率和F1分数等

不过,这些指标衡量的都是预测值与真实值之间的数值差异

在上篇中,我们已经介绍了单项分类模型评估指标:准确率、精确率和召回率,本文主要介绍综合分类问题评估指标:F1分数、ROC曲线和AUC曲线等,而这些指标都是基于单项分类模型评估指标的

2、综合分类模型评估指标

2.1、F1-Score与Fβ-Score


如果我们把精确率(Precision)和召回率(Recall)之间的关系用图来表达,就是下面的PR曲线:

在这里插入图片描述
可以发现两者是“两难全”的关系。理论上来说,精确率和召回率都是越高越好,但更多时候它们两个是矛盾的,经常无法保证二者都很高

为了综合两者的表现,在两者之间找到一个平衡点,就引入了一个新指标Fβ-Score

在这里插入图片描述
可以根据不同的业务场景来调整β值。当β为1时,Fβ-Score就是F1分数(F1-Score),此时,综合平等地考虑了精确率和召回率评估指标,当F1分数较高时则说明模型性能较好

在这里插入图片描述
当β<1时,更关注精确率;当β>1时,更关注召回率

2.2、灵敏度与特异度


ROC和AUC是两个更加复杂的评估指标。它们都基于两个指标:灵敏度(Sensitivity)和特异度(Specificity)

灵敏度也称真正例率(True Positive Rate,TPR),特异度也称假正例率(False Positive Rate,FPR)

  • 灵敏度(TPR)
    在这里插入图片描述
    计算公式为

在这里插入图片描述

  • 1-特异度(FPR)
    在这里插入图片描述
    计算公式为

在这里插入图片描述
可以看到,灵敏度和召回率是一模一样的,只是换了个名称而已。另外,需要注意的是,由于我们只关心正例样本,所以需要查看有多少负例样本被错误地预测为正例样本,因此以上所说的特异度特指1-特异度,而不是真正的特异度

如上图所示,TPR和FPR分别是基于实际表现1和0出发的,也就是说它们分别在实际的正例样本和负例样本中来观察相关概率问题。正因为如此,所以无论样本是否平衡,都不会被影响

例如,总样本中,90%是正例样本,10%是负例样本。我们知道用准确率是有水分的,但是用TPR和FPR不一样。这里,TPR只关注90%正例样本中有多少是被负例覆盖的,而与那10%毫无关系,同理,FPR只关注10%负例样本中有多少是被正例覆盖的,也与那90%毫无关系

所以,如果我们从实际表现的各个结果角度出发,就可以避免样本不平衡的问题了,这也是为什么选用TPR和FPR作为ROC/AUC的指标的原因

在这里插入图片描述
另外,我们也可以从另一个角度理解:条件概率。假设X为预测值,Y为真实值。那么就可以将这些指标按如下条件概率表示

准确率=P(Y=1|X=1)  召回率=灵敏度=P(X=1|Y=1)  1-特异度=P(X=0|Y=0)

从上面三个公式可以看到:如果我们以实际结果为条件(召回率,特异度),那么就只需考虑一种样本;而如果以预测值为条件(准确率),那么我们需要同时考虑正例样本和负例样本

所以以实际

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/23510.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【智能算法】大蔗鼠算法(GCRA)原理及实现

目录 1.背景2.算法原理2.1算法思想2.2算法过程 3.结果展示4.参考文献5.代码获取 1.背景 2024年,JO Agushaka受到自然界中大蔗鼠在交配季节和非交配季节觅食行为启发,提出了大蔗鼠算法(Greater Cane Rat Algorithm, GCRA)。 2.算法…

保利威观看页SDK 官方VUE开源项目 polyv-web-live-watch-sdk

一、安装:node、npm 二、下载源码 polyv-web-live-watch-sdk: 保利威直播观看 SDK 官方文档:保利威帮助中心 进入项目根目录 npm ci #安装依赖,如果 CI 失败,请试一下 npm ci --no-cache --registry=https://registry.npmmirror.com/ npm run dev #启动项目 执行完成后…

Qt图标字体文件中提取字体保存为图片

本文借用别人写的一个IconHelper来做说明。 1. 加载一个字体文件 QScopedPointer<IconHelper> iconHelper(new IconHelper(":/fa-regular-400.ttf", "Font Awesome 6 Pro Regular"));构造函数 IconHelper::IconHelper(const QString &fontFile…

【基础】LwM2M 通讯协议

【基础】LwM2M 通讯协议 LwM2M 协议基础LwM2M 简介LwM2M 基本架构LwM2M 资源定义 LwM2M 协议实现开源协议实现Java LwM2M Client LwM2M 协议基础 LwM2M 简介 LwM2M 的全称为 Lightweight Machine-To-Machine&#xff0c;是一种适用于物联网设备的轻量级的通讯协议&#xff0c…

Flutter基础 -- Flutter布局练习(小项目)

目录 1. Splash 布局&#xff08;第一页&#xff09; 1.1 目标 1.2 当前效果图 1.3 创建 Splash 界面 1.4 设置 MaterialApp 1.5 设置 Splash 背景色 1.6 布局 Splash 界面 1.7 总结 2. Splash 圆角图片 2.1 目标 2.2 当前效果图 2.3 蓝湖下载图片 2.4 图片导入项…

在编程Python的时候发生ModuleNotFoundError: No module named distutils报错怎么办

1.先查看Python版本 首先我们先去打开终端就是先widr再输入cmd 然后进去在输入Python -V要注意大小写 我的版本是3.9.7版本但是我使用的PyCharm 是 2021.1.1 x64版本没有办法主动去识别因为这个版太低了你的Python版本很高所以无法识别 2.解决方法 只需要把你的Python现版…

微信公众号【原子与分子模拟】: 熔化温度 + 超导电性 + 电子化合物 + 分子动力学模拟 + 第一性原理计算 + 数据处理程序

往期内容主要涵盖&#xff1a; 熔化温度 超导电性 电子化合物 分子动力学模拟 第一性原理计算 数据处理程序 【1】熔化温度 分子动力学 LAMMPS 相关内容 【文献分享】分子动力学模拟 LAMMPS 熔化温度 晶体缺陷 熔化方法 LAMMPS 文献&#xff1a;金属熔化行为的局域…

vscode ctrl+鼠标左键无法跳转

打开设置&#xff0c;搜索intel…… 将这个智能感知改成default就可以了&#xff0c;我之前是在disable处。 分析了一下&#xff0c;其实跳转功能主要是根据上下文语法分析来实现的&#xff0c;并不是简单得全文匹配&#xff0c;因此需要相关得语法分析工具。 那么为什么默认式…

微软Edge浏览器深度解析:功能、同步、隐私与安全

微软Edge浏览器是微软公司开发的一款网页浏览器,它基于Chromium内核,提供了快速、安全和兼容性良好的网页浏览体验。以下是关于微软Edge浏览器的详细信息和使用指南: 微软Edge浏览器的主要特点: 1. 基于Chromium内核: 渲染引擎:Chromium内核是基于开源项目Blink的,它…

可视化数据科学平台在信贷领域应用系列五:零代码可视化建模

信贷风控模型是金融机构风险管理的核心工具&#xff0c;在信贷风险管理工作中扮演着至关重要的角色。随着信贷市场的环境不断变化&#xff0c;信贷业务的风险日趋复杂化和隐蔽化&#xff0c;开发和应用准确高效的信贷风控模型显得尤为重要。信贷风险控制面临着越来越大的挑战和…

问你为什么选择Kafka,你会怎么回答?

可靠的含义在百度百科的解释是&#xff1a;可以信赖、可以相信、可靠的朋友。那Kafka究竟是不是一个可靠的朋友呢&#xff1f;既然全世界绝大部分高可用系统都有Kafka的支持&#xff0c;Kafka必定有其过人之处&#xff0c;跟着我来分析分析。 另外多提一嘴Kafka在GitHub目前已…

六西格玛培训,带你解锁职场超能力工具!

当提及六西格玛培训的精髓时&#xff0c;我们不得不提到那些强大而实用的工具&#xff0c;它们如同探险者的指南针&#xff0c;引导我们走向卓越。今天&#xff0c;就让我们一起揭开这些神秘工具的面纱&#xff0c;探寻六西格玛背后的智慧。 首先&#xff0c;DMAIC流程是六西格…

cesium 漫游

token记得换成您自己的&#xff01;&#xff01;&#xff01; 申请cesium的token 官网【Cesium: The Platform for 3D Geospatial】 <template><div id"cesiumContatiner"><!-- <div id"mapContainer1"></div> --></di…

员工离职删除自己做的文件违法么?如何杜绝这种现象?

员工离职时删除自己做的文件是否违法&#xff0c;需要视情况而定&#xff1a; 如果删除的是个人自己的文件&#xff1a; 在这种情况下&#xff0c;员工删除的是自己制作的、不涉及公司机密或经营数据的个人文件&#xff0c;通常不会被视为违法行为。 如果删除的是公司的文件…

探索 CSV 模块:Python 中 CSV 数据持久化的最佳实践

&#x1f340; 前言 博客地址&#xff1a; CSDN&#xff1a;https://blog.csdn.net/powerbiubiu &#x1f44b; 简介 本章节介绍使用 CSV 文件来存储数据&#xff0c;CSV 文件是一种常见的数据格式&#xff0c;可以用来存储和交换表格数据。CSV 文件由一系列的行组成&#x…

SQL Developer管理RESTful 服务

RESTful 服务依赖于ORDS&#xff08;Oracle REST Data Services&#xff09;&#xff0c;所以在进行本实验前&#xff0c;请先确认数据库服务器上的ORDS服务已启动&#xff1a; $ systemctl status ords ● ords.service - Oracle REST Data ServicesLoaded: loaded (/etc/sys…

23中设计模式之一— — — —命令模式的详细介绍

命令模式 Command Pattern讲解 概念描述模式结构主要角色模式的UIM类图模式优点模式缺点应用场景实例演示类图代码演示运行结果 概念 命令模式&#xff08;别名&#xff1a;动作&#xff0c;事务&#xff09; 命令模式是一种行为设计模式&#xff0c;将一个请求封装为一个对象…

【qt】项目移植

项目移植 一.前言二.同名问题三.具体操作1.修改文件名2.修改类名3.修改一些不能自动改的名4.修改.ui文件5.删除原来自动生成的ui_xxx.h文件6.修改头文件 四.导入项目五.使用导入的项目六.项目建议 一.前言 终于概率论考完了,有时间了,接着上个项目,我们继续来完成我们的多窗口开…

【Pycharm】功能介绍

1.Code Reformat Code 格式化代码&#xff0c;可以帮助我们去自动调整空格等&#xff0c;根据python语法规范自动调整 2.Settings 1.创建py文件默认填充模版 3.读写py文件编码格式一致性 顶部代码指定的编码方式作用&#xff1a; 可以保证python2/3解释器在读取文件的时候按…

jmeter并发测试

目录 常用的压测工具jmeter安装配置并执行新建测试计划 Test Plan添加线程组练习01&#xff1a;共10个线程&#xff0c;每秒钟启动一个线程&#xff08;需要10秒&#xff09;&#xff0c;每个线程发送两个请求练习02&#xff1a;共10个线程&#xff0c;1秒中内启动完毕&#xf…