成为AI产品经理——TPR、FPR、ROC、AUC

成为AI产品经理——TPR、FPR、ROC、AUC

news/2025/4/27 18:06:57/文章来源:https://blog.csdn.net/m0_54231818/article/details/134632472

目录

一、PR图、BEP

1.PR图

2.BEP

二、灵敏度、特异度

1.灵敏度

2.特异度

三、真正率、假正率

1.真正率

2.假正率

三、ROC、AUC

1.ROC

2.AUC

四、KS值

一、PR图、BEP

1.PR图

二分类问题模型通常输出的是一个概率值，我们需要设定一个阈值，让大于这个阈值的时候为正样本，其余的为负样本。

如果我们选择不同的阈值，我们就可以得到不同的预测结果，也就可以得到不同的混淆矩阵，从而得到不同的precision值和recall值。P-R图是我们在连续变化的阈值下，得到的准确率和召回率的关系。（召回率作为横轴，将精确率作为纵轴）。

PR 图主要有以下用途：

权衡 Precision 和 Recall： PR 图帮助我们直观地理解在不同阈值下模型的 Precision 和 Recall 的权衡关系。这对于某些应用中 Precision 和 Recall 之间存在权衡关系的情况非常重要，例如在医学领域的疾病诊断中，我们可能更关注 Recall，以确保尽可能多地捕获患者的真实病情。
评估样本不平衡： 当数据集中的类别不平衡时，PR 图比 ROC 曲线更能准确地反映模型性能。在样本不平衡的情况下，ROC 曲线可能给出过于乐观的评估，而 PR 图更能反映模型在正类别上的性能。
选择适当的阈值： PR 图可以帮助选择适当的分类阈值，以满足特定任务的需求。根据应用场景，我们可能更关注 Precision 或 Recall，通过观察 PR 图可以更好地理解不同阈值下的模型表现。
比较模型性能： PR 图可用于比较不同模型的性能。具体来说，我们可以比较不同模型在保持较高 Precision 的同时实现较高 Recall 的能力，或者根据实际需求调整模型的阈值。

下图A模型的曲线完全包住C模型的曲线，我们就说A模型比C模型的效果好；

B模型的曲线完全包住C模型的曲线，我们就说B模型比C模型的效果好；

但是A模型和B模型的曲线有交叉，我们使用BEP进行比较。

2.BEP

BEP是精确率和召回率的平衡点，P=R时，那一条线。如果，模型的PR曲线有交叉，我们可以根据BEP来判断模型的好坏。

BEP过于简单，我们常用F1值来比较模型。F1值是考虑了召回率和精确率的一个计算指标。

$F1 = \frac{2*precision*recall}{precision+recall}$

二、灵敏度、特异度

1.灵敏度

灵敏度的计算公式为：

灵敏度 $= \frac{TP}{TP+FN}$

灵敏度是在实际的正样本中，能够找到正样本的能力。它和召回率的公式一样，它就是召回率。

2.特异度

特异度的计算公式为：

特异度 $=\frac{TN}{TN+FP}$

特异度是指在实际所有的负样本中，找到正确负样本的能力。

三、真正率、假正率

1.真正率

真正率=召回率=灵敏度 $= \frac{TP}{TP+FN}$

真正率的含义是在所有实际的正样本下识别为正样本的概率。

2.假正率

误判率 = 假正率 = 1 - 特异度 = $\frac{FP}{TN+FP}$

因为特异度是在实际的负样本中找到负样本的能力，1-特异度就代表它在所有实际的负样本中找正样本的能力，那这肯定不对啦，在负样本中怎么能找到正样本呢？所有这些正样本是错误的正样本。所以我们把这个概率也叫做假正率。

在我们实际工作中，为了避免样本对于精确率和召回率的影响，可以使用TPR和FPR。

三、ROC、AUC

1.ROC

ROC曲线是我们在连续变化的阈值下，生成不同的正负样本，对应出不同的混淆矩阵，得到不同的TPR和FPR值所绘制出来的一条曲线，它表示TPR和FPR的关系。

图中有一条绿色的直线，这条绿的直线代表真正率和假正率概率一样，也就是这种分类概率和我们随机猜的概率一样，模型效果差，不能用。越靠近这条直线，模型效果越差，这条绿色直线下面的是指，绝大多数情况下，模型的正样本都预测错了，根本不能用。

我们希望的是，真正率高，假正率低，也就是靠近左上方（0，1）的位置，此时真正率接近于1，假正率接近于0

2.AUC

AUC是ROC曲线下面的面积，在绿色直线处，总面积1被一分为二，我们需要直线上面部分的面积，这一部分面积的值为0.5-1，小于0.5不能用。

0.5 - 0.7：效果较低
0.7 - 0.85：效果一般
0.85 - 0.95：效果很好
0.95 - 1：效果非常好，一般不可能。要对这个结果持怀疑态度，进一步分析模型的准确性。

四、KS值

横坐标为在连续的阈值变化下的正样本的个数（概率分数、模型预测数）。纵坐标为TPR和FPR。

KS为在某一阈值的正样本数（概率分数）下，TPR-FPR的值。

KS = TPR - FPR

KS用来评估模型好坏样本的区分程度，有时候人们会把0.6的KS值乘以100，说成60，也正确。

KS<20：欠拟合，模型不具备可用性
KS>20 & KS<30：模型可用
KS>30 & KS<40 ：模型预测能力优秀
KS>40：模型区分度很高。我们需要对这个结果持怀疑态度，进一步分析模型的准确性。

如果模型的AUC或KS值很高，并不是一件好事情。我们要进一步分析模型的准确性，避免是因为数据不准确导致的。

准确率，精准率，召回率，真正率，假正率，ROC/AUC-CSDN博客

参考文献：刘海丰——《成为AI产品经理》

声明：本文是对于刘海丰老师《成为AI产品经理》课程重点的总结，自用，请勿传播。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/news/172223.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

Android aidl的简单使用

Android aidl的简单使用

一.服务端 1.创建aidl文件，然后记得build下生成java文件 package com.example.aidlservice31;// Declare any non-default types here with import statementsinterface IMyAidlServer {// 接收一个字符串参数void setData(String value);// 返回一个字符串String …

阅读更多...

数据结构与算法之贪心: LeetCode 122. 买卖股票的最佳时机II (Typescript版)

数据结构与算法之贪心: LeetCode 122. 买卖股票的最佳时机II (Typescript版)

买卖股票的最佳时机II 给你一个整数数组 prices ，其中 prices[i] 表示某支股票第 i 天的价格。在每一天，你可以决定是否购买和/或出售股票。你在任何时候最多只能持有一股股票。你也可以先购买，然后在同一天出售。返回你能获得的 …

阅读更多...

mybatis配置文件中配置类型别名的方式

mybatis配置文件中配置类型别名的方式

在MyBatis配置文件（通常是mybatis-config.xml）中，可以通过以下方式配置类型别名： 1. 使用typeAliases元素配置全局类型别名 <configuration> <typeAliases> <typeAlias alias"YourAlias" type"…

阅读更多...

简单订单和支付业务的相关流程

简单订单和支付业务的相关流程

1、订单创建、支付及订单处理流程图 2、创建HTTP客户端工具类 Slf4j public class HttpclientUtil {//类中定义了一个私有静态成员变量instance，并且将其初始化为HttpclientUtil类的一个实例，用于实现单例模式。private static HttpclientUtil instance…

阅读更多...

单片机学习6——定时器/计数功能的概念

单片机学习6——定时器/计数功能的概念

在8051单片机中有两个定时器/计数器，分别是定时器/计数器0和定时器/计数器1。 T/C0: 定时器/计数器0 T/C1: 定时器/计数器1 T0: 定时器0 T1: 定时器1 C0: 计数器0 C1: 计数器1 如果是对内部振荡源12分频的脉冲信号进行计数，对每个机器周期计数&am…

阅读更多...

基于springboot+vue的学生宿舍管理系统(前后端分离)

基于springboot+vue的学生宿舍管理系统(前后端分离)

博主主页：猫头鹰源码博主简介：Java领域优质创作者、CSDN博客专家、公司架构师、全网粉丝5万、专注Java技术领域和毕业设计项目实战主要内容：毕业设计(Javaweb项目|小程序等)、简历模板、学习资料、面试题库、技术咨询文末联系获取项目介绍…

阅读更多...

时间序列预测 — LSTM实现单变量风电滚动预测(Keras)

时间序列预测 — LSTM实现单变量风电滚动预测(Keras)

目录 1 数据处理 1.1 数据集简介 1.2 数据集处理 2 模型训练与预测 2.1 模型训练 2.2 模型滚动预测 2.3 结果可视化 1 数据处理 1.1 数据集简介实验数据集采用数据集5：风电机组运行数据集（下载链接），包括风速、风向、温…

阅读更多...

JC/T 456-2015 陶瓷马赛克检测

JC/T 456-2015 陶瓷马赛克检测

陶瓷马赛克是指可拼接贴成联的或可单独铺贴的小规格陶瓷砖，可用于墙面和地面起保护及装饰作用。 JC/T 456-2015 陶瓷马赛克测试： 测试项目测试方法尺寸允许偏差 JC/T 456 外观质量 JC/T 456 吸水率 GB/T 3810.3 耐磨性 GB/T 3810.6 GB/T 381…

阅读更多...

编程语言发展史：JavaScript语言的发展和应用

编程语言发展史：JavaScript语言的发展和应用

预计更新第一部分：早期编程语言 1.1布尔代数和机器语言 1.2汇编语言的出现和发展 1.3高级语言的兴起第二部分：主流编程语言 1.1 C语言的诞生及其影响 1.2 C语言的发展和应用 1.3 Java语言的出现和发展 1.4 Python语言的兴起和特点 1.5 JavaScript语言…

阅读更多...

华为OD机试 - 游戏分组（Java JS Python C）

华为OD机试 - 游戏分组（Java JS Python C）

题目描述部门准备举办一场王者荣耀表演赛，有 10 名游戏爱好者参与，分为两队，每队 5 人。每位参与者都有一个评分，代表着他的游戏水平。为了表演赛尽可能精彩，我们需要把 10 名参赛者分为示例尽量相近的两队。一队的实力可以表示为这一队 5 名队员的评分总和。现在…

阅读更多...

使用Rust开发小游戏

使用Rust开发小游戏

本文是对使用 Rust 开发一个微型游戏【已完结】[1]的学习与记录. cargo new flappy 在Cargo.toml的[dependencies]下方增加: bracket-lib "~0.8.7" main.rs中: use bracket_lib::prelude::*;struct State {}impl GameState for State { fn tick(&mut self,…

阅读更多...

每日一题--相交链表

每日一题--相交链表

离思五首-元稹曾经沧海难为水，除却巫山不是云。取次花丛懒回顾，半缘修道半缘君。目录题目描述： 思路分析： 方法及时间复杂度： 法一计算链表长度(暴力解法) 法二栈法三哈希集合法四 map或unordered_map…

阅读更多...

【面经八股】搜广推方向：常见面试题（二）

【面经八股】搜广推方向：常见面试题（二）

【面经&八股】搜广推方向：常见面试题（二）文章目录【面经&八股】搜广推方向：常见面试题（二）1. FTRL 是什么？(Follow The Regularized Leader)2. 梯度下降方法3. 推荐系统中常见的Embedding方法有哪些？4. Embedding与推荐系统有哪些结合5. FM 和 FFM6. FNN7. 深…

阅读更多...

一文学会使用React-Router v6

一文学会使用React-Router v6

文章目录基本格式createBrowserRouterType Declarationroutesbasenamefuture and window ... 省略 <RouterProvider>fall上述文本提到 createBrowserRouter 函数的一个特性：在非服务器端渲染应用程序时，当它挂载时会初始化所有匹配的路由加载器。…

阅读更多...

解决hbuilder使用android studio模拟器不能热更新

解决hbuilder使用android studio模拟器不能热更新

hbuilder使用android studio模拟器编，在编写代码时，不能热更新，总是需要重启虚拟机中的程序，hbuilderx的版本是3.1.22，android studio的版本是4.2.2 同时在hbuilderx中出现如下报错信息： 报错信息&#x…

阅读更多...

HuggingFace学习笔记--AutoModel的使用

HuggingFace学习笔记--AutoModel的使用

1--AutoModel的使用官方文档 AutoModel 用于加载模型； 1-1--简单Demo 测试代码： from transformers import AutoTokenizer, AutoModelif __name__ "__main__":checkpoint "distilbert-base-uncased-finetuned-sst-2-english"t…

阅读更多...

java进阶---多态

java进阶---多态

多态的概述什么是多态同一个对象,在不同时刻表现出来的不同形态多态的前提要有继承或实现关系要有方法的重写要有父类引用指向子类对象多态的具体实现对象的多态是多态的核心和重点规则: 一个对象的编译类型与运行类型可以不一致编译类型在定义对象时,就确定了,…

阅读更多...

三数之和问题

三数之和问题

给你一个整数数组 nums ，判断是否存在三元组 [nums[i], nums[j], nums[k]] 满足 i ! j、i ! k 且 j ! k ，同时还满足 nums[i] nums[j] nums[k] 0 。请你返回所有和为 0 且不重复的三元组。注意：答案中不可以包含重复的三元组。示例 1&…

阅读更多...

【笔记 Pytorch 08】深度学习模板 (未完）

【笔记 Pytorch 08】深度学习模板 (未完）

文章目录一、声明二、工程结构三、文件内容main.pymodel.pydataset.pyutils.py 四、问题汇总一、声明非常感谢这些资料的作者： 【参考1】、【PyTorch速成教程 (by Sung Kim)】二、工程结构 ├── main.py：实现训练 (train) 、验证(validation)和…

阅读更多...

python pip安装第三方包时报错 error: Microsoft Visual C++ 14.0 or greater is required.

python pip安装第三方包时报错 error: Microsoft Visual C++ 14.0 or greater is required.

文章目录 1.问题2.原因3.解决办法 1.问题 pip install 的时候报错一大堆，其中有这么一段话 👇 error: Microsoft Visual C 14.0 or greater is required. Get it with "Microsoft C Build Tools": https://visualstudio.microsoft.com/visua…

阅读更多...

最新文章