模型评估指标(三)

模型评估指标(三)

diannao/2025/7/1 7:31:05/文章来源:https://blog.csdn.net/weixin_55629186/article/details/139499276

模型评估指标三

- 1、模型评估回顾
- 2、综合分类模型评估指标
- - 2.1、F1-Score与Fβ-Score
  - 2.2、灵敏度与特异度
  - 2.3、ROC曲线
  - 2.4、AUC曲线
- 3、分类模型评估指标总结
- 4、Sklearn模型评估指标

1、模型评估回顾

本文接上篇：模型评估指标(二)

分类模型的评估与回归模型的侧重点不同，回归模型针对连续型的数据，而分类模型针对的是离散的数据

因此，分类模型的评估指标也与回归模型不同，回归模型的评估指标包括均方误差（MSE）、均方根误差（RMSE）和平均绝对误差（MAE）等，分类模型的评估指标通常包括准确率、精确率、召回率和F1分数等

不过，这些指标衡量的都是预测值与真实值之间的数值差异

在上篇中，我们已经介绍了单项分类模型评估指标：准确率、精确率和召回率，本文主要介绍综合分类问题评估指标：F1分数、ROC曲线和AUC曲线等，而这些指标都是基于单项分类模型评估指标的

2、综合分类模型评估指标

2.1、F1-Score与Fβ-Score

如果我们把精确率（Precision）和召回率（Recall）之间的关系用图来表达，就是下面的PR曲线：

在这里插入图片描述
可以发现两者是“两难全”的关系。理论上来说，精确率和召回率都是越高越好，但更多时候它们两个是矛盾的，经常无法保证二者都很高

为了综合两者的表现，在两者之间找到一个平衡点，就引入了一个新指标Fβ-Score

在这里插入图片描述
可以根据不同的业务场景来调整β值。当β为1时，Fβ-Score就是F1分数（F1-Score），此时，综合平等地考虑了精确率和召回率评估指标，当F1分数较高时则说明模型性能较好

在这里插入图片描述
当β＜1时，更关注精确率；当β＞1时，更关注召回率

2.2、灵敏度与特异度

ROC和AUC是两个更加复杂的评估指标。它们都基于两个指标：灵敏度（Sensitivity）和特异度（Specificity）

灵敏度也称真正例率（True Positive Rate，TPR），特异度也称假正例率（False Positive Rate，FPR）

灵敏度（TPR）

计算公式为

在这里插入图片描述

1-特异度（FPR）

计算公式为

在这里插入图片描述
可以看到，灵敏度和召回率是一模一样的，只是换了个名称而已。另外，需要注意的是，由于我们只关心正例样本，所以需要查看有多少负例样本被错误地预测为正例样本，因此以上所说的特异度特指1-特异度，而不是真正的特异度

如上图所示，TPR和FPR分别是基于实际表现1和0出发的，也就是说它们分别在实际的正例样本和负例样本中来观察相关概率问题。正因为如此，所以无论样本是否平衡，都不会被影响

例如，总样本中，90%是正例样本，10%是负例样本。我们知道用准确率是有水分的，但是用TPR和FPR不一样。这里，TPR只关注90%正例样本中有多少是被负例覆盖的，而与那10%毫无关系，同理，FPR只关注10%负例样本中有多少是被正例覆盖的，也与那90%毫无关系

所以，如果我们从实际表现的各个结果角度出发，就可以避免样本不平衡的问题了，这也是为什么选用TPR和FPR作为ROC/AUC的指标的原因

在这里插入图片描述
另外，我们也可以从另一个角度理解：条件概率。假设X为预测值，Y为真实值。那么就可以将这些指标按如下条件概率表示

准确率=P(Y=1|X=1) 召回率=灵敏度=P(X=1|Y=1) 1-特异度=P(X=0|Y=0)

从上面三个公式可以看到：如果我们以实际结果为条件（召回率，特异度），那么就只需考虑一种样本；而如果以预测值为条件（准确率），那么我们需要同时考虑正例样本和负例样本

所以以实际

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/diannao/23510.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

【智能算法】大蔗鼠算法（GCRA）原理及实现

【智能算法】大蔗鼠算法（GCRA）原理及实现

目录 1.背景2.算法原理2.1算法思想2.2算法过程 3.结果展示4.参考文献5.代码获取 1.背景 2024年，JO Agushaka受到自然界中大蔗鼠在交配季节和非交配季节觅食行为启发，提出了大蔗鼠算法（Greater Cane Rat Algorithm, GCRA）。 2.算法…

阅读更多...

保利威观看页SDK 官方VUE开源项目 polyv-web-live-watch-sdk

保利威观看页SDK 官方VUE开源项目 polyv-web-live-watch-sdk

一、安装：node、npm 二、下载源码 polyv-web-live-watch-sdk: 保利威直播观看 SDK 官方文档：保利威帮助中心进入项目根目录 npm ci #安装依赖，如果 CI 失败，请试一下 npm ci --no-cache --registry=https://registry.npmmirror.com/ npm run dev #启动项目执行完成后…

阅读更多...

备份Docker部署的MySQL

备份Docker部署的MySQL

文章目录一、MySQL备份脚本1.本地部署的MySQL1.1 备份脚本1.2 添加权限1.3 执行脚本1.4 计划任务自动备份（可选） 2.备份Docker部署的MySQL 一、MySQL备份脚本 1.本地部署的MySQL 1.1 备份脚本 # vi mysql_backup.sh #!/bin/bash # MySQL连接参数 …

阅读更多...

C++中成员函数和变量的存储、this指针的使用和const关键词以及常对象

C++中成员函数和变量的存储、this指针的使用和const关键词以及常对象

文章目录 1.成员变量和成员函数分开存储2.this指针1.概念2.链式调用 3.空指针调用成员函数4.const修饰成员函数5.常对象 1.成员变量和成员函数分开存储成员变量： 成员变量是类的数据部分，它们存储了类的实例（对象）的状态信息。当…

阅读更多...

Qt图标字体文件中提取字体保存为图片

Qt图标字体文件中提取字体保存为图片

本文借用别人写的一个IconHelper来做说明。 1. 加载一个字体文件 QScopedPointer<IconHelper> iconHelper(new IconHelper(":/fa-regular-400.ttf", "Font Awesome 6 Pro Regular"));构造函数 IconHelper::IconHelper(const QString &fontFile…

阅读更多...

【基础】LwM2M 通讯协议

【基础】LwM2M 通讯协议

【基础】LwM2M 通讯协议 LwM2M 协议基础LwM2M 简介LwM2M 基本架构LwM2M 资源定义 LwM2M 协议实现开源协议实现Java LwM2M Client LwM2M 协议基础 LwM2M 简介 LwM2M 的全称为 Lightweight Machine-To-Machine，是一种适用于物联网设备的轻量级的通讯协议&#xff0c…

阅读更多...

Flutter基础 -- Flutter布局练习（小项目）

Flutter基础 -- Flutter布局练习（小项目）

目录 1. Splash 布局（第一页） 1.1 目标 1.2 当前效果图 1.3 创建 Splash 界面 1.4 设置 MaterialApp 1.5 设置 Splash 背景色 1.6 布局 Splash 界面 1.7 总结 2. Splash 圆角图片 2.1 目标 2.2 当前效果图 2.3 蓝湖下载图片 2.4 图片导入项…

阅读更多...

在编程Python的时候发生ModuleNotFoundError: No module named distutils报错怎么办

在编程Python的时候发生ModuleNotFoundError: No module named distutils报错怎么办

1.先查看Python版本首先我们先去打开终端就是先widr再输入cmd 然后进去在输入Python -V要注意大小写我的版本是3.9.7版本但是我使用的PyCharm 是 2021.1.1 x64版本没有办法主动去识别因为这个版太低了你的Python版本很高所以无法识别 2.解决方法只需要把你的Python现版…

阅读更多...

微信公众号【原子与分子模拟】：熔化温度 + 超导电性 + 电子化合物 + 分子动力学模拟 + 第一性原理计算 + 数据处理程序

微信公众号【原子与分子模拟】：熔化温度 + 超导电性 + 电子化合物 + 分子动力学模拟 + 第一性原理计算 + 数据处理程序

往期内容主要涵盖： 熔化温度超导电性电子化合物分子动力学模拟第一性原理计算数据处理程序【1】熔化温度分子动力学 LAMMPS 相关内容【文献分享】分子动力学模拟 LAMMPS 熔化温度晶体缺陷熔化方法 LAMMPS 文献：金属熔化行为的局域…

阅读更多...

后端返回图片格式乱码

后端返回图片格式乱码

try {const response await request.get(checkCodeUrl.value,{responseType:"arraybuffer"});console.log("验证码请求成功:", response);checkCodeUrl.value data: image/jpeg;base64,${btoa(new Uint8Array(response).reduce((data, byte) > data …

阅读更多...

『大模型笔记』大型语言模型(LLMs)微调(Fine-tuning)优化研究！

『大模型笔记』大型语言模型(LLMs)微调(Fine-tuning)优化研究！

大型语言模型(LLMs)微调(Fine-tuning)优化研究！文章目录一. 摘要二. 大模型优化技术概述2.1 梯度检查点(Gradient Checkpointing)2.2 低秩适应2.3 DeepSpeed2.4 Flash Attention三. GPU内存需求的理论分析3.1. 模型状态内存(Model states memory) - 模型参数、梯度、优化器状…

阅读更多...

vscode ctrl+鼠标左键无法跳转

vscode ctrl+鼠标左键无法跳转

打开设置，搜索intel…… 将这个智能感知改成default就可以了，我之前是在disable处。分析了一下，其实跳转功能主要是根据上下文语法分析来实现的，并不是简单得全文匹配，因此需要相关得语法分析工具。那么为什么默认式…

阅读更多...

微软Edge浏览器深度解析：功能、同步、隐私与安全

微软Edge浏览器深度解析：功能、同步、隐私与安全

微软Edge浏览器是微软公司开发的一款网页浏览器，它基于Chromium内核，提供了快速、安全和兼容性良好的网页浏览体验。以下是关于微软Edge浏览器的详细信息和使用指南：微软Edge浏览器的主要特点： 1. 基于Chromium内核：渲染引擎：Chromium内核是基于开源项目Blink的，它…

阅读更多...

可视化数据科学平台在信贷领域应用系列五：零代码可视化建模

可视化数据科学平台在信贷领域应用系列五：零代码可视化建模

信贷风控模型是金融机构风险管理的核心工具，在信贷风险管理工作中扮演着至关重要的角色。随着信贷市场的环境不断变化，信贷业务的风险日趋复杂化和隐蔽化，开发和应用准确高效的信贷风控模型显得尤为重要。信贷风险控制面临着越来越大的挑战和…

阅读更多...

问你为什么选择Kafka，你会怎么回答？

问你为什么选择Kafka，你会怎么回答？

可靠的含义在百度百科的解释是：可以信赖、可以相信、可靠的朋友。那Kafka究竟是不是一个可靠的朋友呢？既然全世界绝大部分高可用系统都有Kafka的支持，Kafka必定有其过人之处，跟着我来分析分析。另外多提一嘴Kafka在GitHub目前已…

阅读更多...

六西格玛培训，带你解锁职场超能力工具！

六西格玛培训，带你解锁职场超能力工具！

当提及六西格玛培训的精髓时，我们不得不提到那些强大而实用的工具，它们如同探险者的指南针，引导我们走向卓越。今天，就让我们一起揭开这些神秘工具的面纱，探寻六西格玛背后的智慧。首先，DMAIC流程是六西格…

阅读更多...

python小游戏：猜数字、猜动物、单词接龙（带界面）

python小游戏：猜数字、猜动物、单词接龙（带界面）

正在学习python的各位童鞋，可以多多找些程序来练练手，从而更快的掌握python编程。这里就为大家找了三个示例小程序：猜数字、猜动物、单词接龙。一、猜数字程序会随机生成一个1到100之间的数字，然后让用户尝试猜测这个数字。用户…

阅读更多...

cesium 漫游

cesium 漫游

token记得换成您自己的！！！ 申请cesium的token 官网【Cesium: The Platform for 3D Geospatial】 <template><div id"cesiumContatiner"></di…

阅读更多...

如何理解敏捷开发和瀑布模型的区别

如何理解敏捷开发和瀑布模型的区别

敏捷开发和瀑布模型是两种不同的软件开发方法，它们在多个方面存在显著的差异。以下是它们之间的主要区别： 开发流程： 瀑布模型：采用线性的开发流程，按照预先规划的顺序依次进行需求分析、设计、编码、测试和维护等环节…

阅读更多...

【蒙特卡洛仿真的corner】

【蒙特卡洛仿真的corner】

蒙特卡洛仿真的corner global variation指的是不同晶圆之间的process的差别 local variation指的是同一个晶圆内的不同管子之间的mismatch smic40ll工艺中，ttg，ssg，sfg，fsg corner只包含mismatch ss，tt，sf&…

阅读更多...

最新文章