【统计学】Top-down自上而下的角度模型召回率recall,精确率precision,特异性specificity,模型评价

最近在学 logistic regression model,又遇见了几个之前的老面孔。
召回率recall, 精确率precision,特异性spcificity,准确率accuracy,True positive rate,false positive rate等等名词在学习之初遇到的困难在于,理解各自的意思,对于评估模型的意义,以及将相关名词联系在一起。也是初学者,谨希望给大家学习时提供一些思路。

1.召回率recall, 精确率precision,特异性spcificity,准确率accuracy这些指标分别让我们了解什么(通俗版)

想象我们有一个样本集,其中有我们需要的数据,以及我们不需要的数据;或者想象一个数据集包括不同的人脸,有笑脸,哭脸、面无表情脸,我们其中需要识别的是笑脸
准确率accuracy:做出正确预测的能力
你能做出正确的预测的概率(我们测试的模型识别出是笑脸的数据和不是笑脸的数据其中识别正确的部分)
召回率recall: 对需要识别的数据是否敏感
另外一个名字是敏感性sensitivity,代表给你需要识别的正的样本中,你能识别的部分;对正确的样本识别能力,是否能有效地捕捉我们所需要的样本?(给你所有的笑脸图像,你能识别的部分)(真实情况中,我们并不知道有多少数据是笑脸,我们需要知道的是模型能否有效地将尽可能多地笑脸识别出来(从茫茫数据海中捞出来,带回来,召回来),因此理解成召回率)
精确率precision识别判断准确的能力,你选出正确的部分有多少是确实正确的,也叫Hit rate(你说这些是笑脸图,那么我需要知道里面确实是笑脸图的部分;精确到小数点后x位,证明着x位之前的数字都是对的)How many patients predicted as having stroke really has stroke.
特异性specificity 识别非样本的能力specific翻译成中文可以是具体、明确、独特、特定的,代表你指出的不属于我要找的样本中,有多少确实不属于?(确实不是笑脸的样本中你能识别出确实不属于笑脸图的部分;不要往“你能识别出不是笑脸图的,确实不属于笑脸图的部分“或者”不属于笑脸图这个判断正确的概率“去想,会导致你对分母及计算方式的误解)

通过上面的学习,先把中文和英文对应上,然后咱们再来区分

1.(i)精确、具体、敏感之间怎么区分

总结下,精确——做出(正确)判断正确的概率,
敏感——对正确集做出正确分类与识别的概率
具体——对错误集进行正确分类与识别的概率
Specificity 与 Sensitivity(敏感性,也称为 True Positive Rate 或 Recall)一起使用可以提供全面的模型性能评估。在某些应用中,需要权衡 Specificity 和 Sensitivity,以确定模型的最佳工作点,具体取决于问题的重要性和应用背景。

1.(ii) 引入Confusion Matrix

在这里插入图片描述

  • Accuracy = TP+TN/(TP+TN+FP+FN) %
  • Recall/True Positive Rate/Sensitivity = TP/(TP+FN)
  • Specificity = TN/(TN+FP)
  • Precision/Hit Rate (of Event) = TP/(TP+FP)

1.(iii) TP, TN, FP, FN Rate区分及计算方式

这四个指标出现在Confusion Matrix里面,因为计算方式与之前认识的四个指标中部分相同,所以也同样会用于评价模型的效果
Negative和Positive代表的是模型做出的判断,因为列代表的是predicted values即模型的结果,所以一个列是N一列是P
True 和False 代表的是该判断是错还是对,因为行代表的是Actual values,一行必定有一个判断正确,一个判断错误,所以对角线上的T或P值会相同
这四个指标从中文理解比较方便,比如FN假阴性,做出了阴性的假定但是错了, 实际上它是阳性的Positive的;FP做出了阳性的假定但是这个假定是错的,实际上它是阴性的

Rate这个理解比较重要,规律就是除以实际的T或者P。比如FNR就是对于
True Positive rate 真阳性= TP/Actual Yes=TP/(TP+FN)
True Negative rate 真负类= TN/Actual No=TN/(TN+FP)
False Positive rate 假阳性= FP/Actual No=FP/(FP+TN)
False Negative rate假阴性 = FN/Actual Yes=FN/(FN+TP)

跟之前学习的Recall, precision, accuracy, specificity联动一下
TP rate = recall, sensitivity
TN rate = specificity

对了,还记得统计学学过的两类错误吗,Type1 某个人怀孕了你测不出来(原假设为真时却错误地拒绝了原假设,弃真)=FP rate
Type2 某个人没怀孕,你说它怀孕了(原假设为假时却错误地未能拒绝原假设,被坏人骗了)= FN Rate

ps: 在某些情况下,降低 Type 2 error 的重要性更大,特别是当未能检测到某种效应或差异可能具有严重后果时。例如,在医学诊断中,未能检测到疾病可能导致病人未能获得及时的治疗,从而增加了危险。所以FN rate很重要。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/93463.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【Java每日一题】— —第十八题:求二维数组中的元素最小值及其索引。(2023.10.02)

🕸️Hollow,各位小伙伴,今天我们要做的是第十八题。 🎯问题: 求二维数组中的元素最小值及其索引。 测试结果如下: 🎯 答案: int [][]anew int[3][];a[0]new int [3];a[1]new int[5…

全国排名前三的直播公司无锋科技入驻天府蜂巢成都直播产业基地

最近,全国排名前三的直播公司——无锋科技,正式宣布入驻位于成都的天府蜂巢直播产业基地,这一消息引起了业内人士的高度关注。成都直播产业基地一直是中国直播产业的重要地标之一,其强大的技术和资源优势为众多直播公司提供了广阔…

postgresql-管理表空间

postgresql-管理表空间 基本概念创建表空间用户授权移动表空间 修改表空间移动表空间位置 删除表空间 基本概念 在 PostgreSQL 中,表空间(tablespace)表示数据文件的存放目录,这些数据文件代表了数 据库的对象,例如表…

Oracle SQL Developer 中查看表的数据和字段属性、录入数据

在Oracle SQL Developer中,选中一个表时,右侧会列出表的情况;第一个tab是字段的名称、数据类型等属性; 切换到第二个tab,显示表的数据; 这和sql server management studio不一样的; 看一下部门…

常用的分布式ID解决方案原理解析

目录 前言 一:分布式ID的使用场景 二:分布式ID设计的技术指标 三:常见的分布式ID生成策略 3.1 UUID 3.2 数据库生成 3.3 数据库的多主模式 3.4 号段模式 3.5 雪花算法 前言 分布式ID的生成是分布式系统中非常核心的基础性模块&#…

【C语言】宏定义

🚩 WRITE IN FRONT🚩 🔎 介绍:"謓泽"正在路上朝着"攻城狮"方向"前进四"🔎🏅 荣誉:2021|2022年度博客之星物联网与嵌入式开发TOP5|TOP4、2021|2222年获评百大博…

Docker下如何构建包含延迟插件的RabbitMQ镜像

👨🏻‍💻 热爱摄影的程序员 👨🏻‍🎨 喜欢编码的设计师 🧕🏻 擅长设计的剪辑师 🧑🏻‍🏫 一位高冷无情的编码爱好者 大家好,我是 DevO…

OpenGLES:绘制一个彩色、旋转的3D圆柱

一.概述 上一篇博文讲解了怎么绘制一个彩色旋转的立方体 这一篇讲解怎么绘制一个彩色旋转的圆柱 圆柱的顶点创建主要基于2D圆进行扩展,与立方体没有相似之处 圆柱绘制的关键点就是将圆柱拆解成:两个Z坐标不为0的圆 一个长方形的圆柱面 绘制2D圆的…

基于Java的老年人体检管理系统设计与实现(源码+lw+部署文档+讲解等)

文章目录 前言具体实现截图论文参考详细视频演示为什么选择我自己的网站自己的小程序(小蔡coding)有保障的售后福利 代码参考源码获取 前言 💗博主介绍:✌全网粉丝10W,CSDN特邀作者、博客专家、CSDN新星计划导师、全栈领域优质创作…

SNERT预备队招新CTF体验赛-Web(SWCTF)

目录 1、F12 2、robots 3、game1-喂青蛙 4、game 2 - flap bird 5、game 3 - Clash 6、Get&Post 7、sql (1)手工注入 (2)工具注入 8、命令执行漏洞 9、文件上传漏洞 10、文件泄露 11、php反序列化漏洞 12、PHP绕…

数据结构之双链表

双链表 1.复杂方法的图分析2.My_LinkedList代码3.接口MY_lIST4.测试类 1.复杂方法的图分析 2.My_LinkedList代码 package My_liNKEDlIST;public class My_LinkedList implements MY_lIST{static class ListNode{public int val;public ListNode prev;public ListNode next;pub…

Git使用【下】

欢迎来到Cefler的博客😁 🕌博客主页:那个传说中的man的主页 🏠个人专栏:题目解析 🌎推荐文章:题目大解析(3) 目录 👉🏻标签管理理解标签标签运用 …

SSM - Springboot - MyBatis-Plus 全栈体系(十七)

第三章 MyBatis 五、MyBatis 高级扩展 1. mapper 批量映射优化 1.1 需求 Mapper 配置文件很多时,在全局配置文件中一个一个注册太麻烦,希望有一个办法能够一劳永逸。 1.2 配置方式 Mybatis 允许在指定 Mapper 映射文件时,只指定其所在的…

函数、函数的傅里叶级数展开、傅里叶级数的和函数之间的关系

1.函数、函数的傅里叶级数展开、傅里叶级数的和函数之间的关系 1.1 傅里叶级数中的系数公式推导 我们先来推导一下傅里叶级数中的系数公式,其实笔者已经写过一篇相关笔记,详见:为什么要把一个函数分解成三角函数?(傅利叶级数) f ( x )…

用AI原生向量数据库Milvus Cloud 搭建一个 AI 聊天机器人

搭建聊天机器人 一切准备就绪后,就可以搭建聊天机器人了。 文档存储 机器人需要存储文档块以及使用 Towhee 提取出的文档块向量。在这个步骤中,我们需要用到 Milvus。 安装轻量版 Milvus Lite,使用以下命令运行 Milvus 服务器: (chatbot_venv) [egoebelbecker@ares milvus_…

Python中匹配模糊的字符串

嗨喽~大家好呀,这里是魔王呐 ❤ ~! python更多源码/资料/解答/教程等 点击此处跳转文末名片免费获取 如何使用thefuzz 库,它允许我们在python中进行模糊字符串匹配。 此外,我们将学习如何使用process 模块,该模块允许我们在模糊…

条件查询和数据查询

一、后端 1.controller层 package com.like.controller;import com.like.common.CommonDto; import com.like.entity.User; import com.like.service.UserService; import jakarta.annotation.Resource; import org.springframework.web.bind.annotation.GetMapping; import …

C语言 —— 函数

目录 1. 函数是什么 2. C语言中函数的分类 2.1 库函数 2.2 自定义函数 3. 函数的参数 3.1 实际参数(实参) 3.2 形式参数(形参) 4. 函数的调用 4.1 传值调用 4.2 传址调用 5. 函数的嵌套调用和链式访问 5.1 嵌套调用 5.2 链式访问 6. 函数的声明和定义 6.1函数声明…

24Hibench

1. Hibench 官网 ​ HiBench is a big data benchmark suite that helps evaluate different big data frameworks in terms of speed, throughput and system resource utilizations. It contains a set of Hadoop, Spark and streaming workloads, including Sort, WordCou…

JavaSE | 初始Java(九) | 包的使用

包 包是对类、接口等的封装机制的体现,是一种对类或者接口等的很好的组织方式,比如:一个包中的类不想被其他包中的类使用。包还有一个重要的作用:在同一个工程中允许存在相同名称的类,只要处在不同的包中即可。 可以…