一文带你了解混淆矩阵!

来源 | 数据科学CLUB

封图 | CSDN 下载自视觉中国

混淆矩阵是一个表,经常用来描述分类模型(或“分类器”)在已知真实值的一组测试数据上的性能。混淆矩阵本身比较容易理解,但是相关术语可能会令人混淆。

让我们从一个二进制分类器的混淆矩阵示例开始(尽管它可以很容易地扩展到两个以上的类):

我们能从这个矩阵中了解到什么?

  • 有两种可能的预测类:“yes”和“no”。例如,如果我们预测一种疾病的存在,“yes”意味着他们有这种疾病,“no”意味着他们没有这种疾病。

  • 分类器总共做出165个预测(例如,165名患者正在接受该疾病存在的测试)。

  • 在这165个病例中,分类器预测“yes”110次,“no”55次。

  • 事实上,样本中有105名患者患有此病,60名患者没有患病。

现在让我们定义最基本的术语:

  • true positives (TP): 在这些情况下,我们预测“yes”(他们有这种病),并且他们确实有这种病。

  • true negatives (TN): 我们预测“no”,事实上他们确实没有患病。

  • false positives (FP): 我们预测“yes”,但是他们实际上并没有患病。(也称为“第一类错误”。)

  • false negatives (FN): 我们预测“no”,但他们确实有这种疾病。(也称为“第二类错误”。)

我已经将这些项添加到混淆矩阵中,并且添加了行和列总数:

这是一个比率的列表,通常是从一个混淆矩阵的二元分类器里得出:

  • 准确率(Accuracy):总的来说,分类器的准确率是多少?

    • (TP+TN)/total = (100+50)/165 = 0.91

  • 误分类率(Misclassification Rate):总的来说,错分类的频率是多少?

    • (FP+FN)/total = (10+5)/165 = 0.09

    • 等于1减去准确率

    • 也被称为“错误率(Error Rate)”

  • 真阳性率(True Positive Rate):当它实际上是“yes”时,它预测为“yes”的频率是多少?

    • TP/actual yes = 100/105 = 0.95

    • 也被称为"Sensitivity"或"Recall"

  • 假阳性率(False Positive Rate):当它实际上是“no”的时候,它预测为“yes”的频率是多少?

    • FP/actual no = 10/60 = 0.17

  • 真阴性率(True Negative Rate):当它实际上是“no”时,它预测“no”的频率是多少?

    • TN/actual no = 50/60 = 0.83

    • 等于1减去假阳性率

    • 也被称为"特异性(Specificity)"

  • 精度(Precision):当它预测“yes”类时,正确预测的概率是多少?

    • TP/predicted yes = 100/110 = 0.91

  • Prevalence:在我们的样本中,“yes”条件实际发生的频率是多少?

  • actual yes/total = 105/165 = 0.64

还有几个术语也值得一提:

  • 零错误率(Null Error Rate): 这是如果你总是预测大多数类,你就会错的频率。(在我们的例子中,零错误率将是60/165=0.36,因为如果你总是预测yes,那么您只会在60个“no”的情况下出错。)这可以作为比较分类器的基准度量。然而,对于一个特定的应用程序,最好的分类器有时会有比零错误率更高的错误率,正如 “Accuracy Paradox(精确度悖论)”所证明的那样。

  • Cohen's Kappa: 这本质上是对分类器的性能的一种度量,与它仅仅是偶然的性能进行比较。换句话说,如果模型的准确率和零错误率之间有很大的差异,那么模型的Kappa分数就会很高。

  • F Score:这是真实阳性率(召回率)和正确率的加权平均值。

  • ROC曲线:这是一个常用的图表,它总结了分类器在所有可能阈值上的性能。当你改变将观察值分配给给定类的阈值时,通过绘制真阳性率(y轴)与假阳性率(x轴)来生成它。

推荐阅读
  • 如何成为一名黑客?

  • 一篇与众不同的 String、StringBuilder 和 StringBuffer 详解

  • 干货 | 大白话彻底搞懂 HBase RowKey 详细设计

  • 发送0.55 ETH花费近260万美元!这笔神秘交易引发大猜想

  • Python 爬取周杰伦《Mojito》MV 弹幕,这个评论亮了!

  • 谷歌 Chrome 将弃用“黑名单”,“Master/Slave”主从模式也要换名?

  • 京东姚霆:推理能力,正是多模态技术未来亟需突破的瓶颈!

真香,朕在看了!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/517540.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

从0到千万DAU,这5年闲鱼架构如何演进?

阿里妹导读:闲鱼品牌创立于14年阿里的某个茶水间,从0开始到现在千万DAU,5年时间里闲鱼见证了闲置物品从线下到线上交易的转移。而线上交易的繁荣,则需要业务架构做相应的调整、演进才能支撑业务的快速发展。本文主要通过介绍闲鱼从…

初创公司5大Java服务困局,阿里工程师如何打破?

阿里妹导读:初创公司遇到的每一个问题都可能攸关生死。创业之初更应该总结行业的常见问题,对比方案寻找最优解。阿里巴巴地图技术专家常意在技术圈摸爬滚打数年,接触了各式各样的Java服务端架构。服务端问题见得多了,也就更能分辨…

Navicat for MySQL连接MySQL数据库时各种错误解决

一 、2058错误 通过命令行进入MySQL,执行如下命令: ALTER USER rootlocalhost IDENTIFIED WITH mysql_native_password BY root截图: 二、1251错误 通过命令行进入MySQL,执行如下命令: ALTER USER rootlocalhost I…

构建灵活工作方式 戴尔最智能商用客户端产品线全面上市

戴尔Latitude、Precision和OptiPlex产品组合再次全面升级,带来更高水平生产力 2020年6月12日,随着“新基建”首次被写入《政府工作报告》,数字经济将成为释放经济新动能的最重要途径。在企业加速数字化转型的过程中,生产力转型是…

秒杀场景_解决秒杀超卖问题_04

文章目录一、商品微服务改造二、秒杀微服务改造2.1. SkillGoodService 改造2.2. MutilThreadOrder 改造一、商品微服务改造 SkillGoodService改造 package com.gblfy.service;import com.gblfy.dao.SkillGoodRepository; import com.gblfy.entity.SkillGood; import lombok.R…

初识 Knative: 跨平台的 Serverless 编排框架

Knative 是什么 Knative 是 Google 在 2018 的 Google Cloud Next 大会上发布的一款基于 Kubernetes 的 Serverless 框架。Knative 一个很重要的目标就是制定云原生、跨平台的 Serverless 编排标准。Knative 是通过整合容器构建(或者函数)、工作负载管理(和动态扩缩)以及事件模…

python使用PyMysql连接MySQL实现增删改查

文章目录一、安装PyMysql:1.方式一:使用命令行2.方式二:通过PyCharm编译器二、操作MySQL数据库步骤1. 使用import导入相应的类2.获得数据库的连接3.创建游标对象4.执行SQL语句5.关闭数据库连接三、案例1. 查询单条数据2. 查询多条数据3.创建数…

一分钟解决 Github 访问慢

文章目录1. 获取域名对应的ip2. 复制ip3. 配置hostsgithub.com对应的ip有多个选一个响应快的即可,但是一直在变,用的时候,设置一次即可 1. 获取域名对应的ip https://tool.chinaz.com/dns/?type1&hostgithub.com&ip 2. 复制ip 3. …

做一个高一致性、高性能的Flutter动态渲染,真的很难么?

Flutter动态模板渲染架构升级 ​ 最近小组在尝试使用集团DinamicX的DSL,通过下发DSL模板,实现Flutter端的动态化模板渲染。我们解决了性能方面的问题后,又面临了一个新的挑战——渲染一致性。我们该如何在不降低渲染性能的前提下&#xff0c…

数据科学产业中哪些架构最热门?本文为你盘点了 5 款!

作者 | Sai Krishna译者 | 火火酱,责编 | Carol封图 | CSDN 付费下载自视觉中国地球上的数据量每分每秒都在增加,海量的数据源源不断地从四面八方涌入各种机构组织,而这些数据最终或许会成为能够指引我们做出战略决策的宝贵财富。这就是数据科…

面向云原生的混沌工程工具-ChaosBlade

作者 | 肖长军(穹谷)阿里云智能事业群技术专家 导读:随着云原生系统的演进,如何保障系统的稳定性受到很大的挑战,混沌工程通过反脆弱思想,对系统注入故障,提前发现系统问题,提升系…

centOS docker容器的安装

文章目录一、docker安装步骤1.卸载旧版本2.安装依赖3.添加镜像源4.查看仓库中的所有docker版本5.安装docker6.启动docker7.设置开机自启动docker8.查看docker是否安装成功9.卸载docker一、docker安装步骤 提示:安装之前可以使用命令:yum check-update检查…

泡着枸杞写bug的三流程序员凭什么逆袭到一线大厂?

大多数互联网的从业者都有一个梦想:进大厂。因为不仅可以享受较好的福利待遇,也能与更优秀的人一起共事,获得更专业、更快速的成长。最近经常有朋友提及想要入门编程学习,该如何学习?关于编程学习,各种语言…

哪种人是软件设计中的稀缺型人才?

阿里妹导读:好的系统架构离不开好的接口设计,因此,真正懂接口设计的人往往是软件设计队伍中的稀缺型人才。 为什么在接口制定标准中说:一流的企业做标准,二流的企业做品牌,三流的企业做产品?依赖…

快速Ubuntu的配置(以ubuntu 20.04桌面版为例)

文章目录一、💖更换镜像源二、💖安装VMware Tools工具三、💖安装Google浏览器四、💖安装搜狗输入法五、💖安装C/C开发工具Clion🍀1.安装编译环境🍀2.安装开发环境一、💖更换镜像源 …

阿里工程师太凶残了,竟把服务器泡在“水里”!

万众瞩目的第11个双11要来了!这次天猫说要帮大家省500亿,身边加购物车、组队盖楼的同学数不胜数,热闹非凡。 但在阿里,有一位低调的“高冷男”,丝毫不为红红火火的双11所动,依然稳如磐石、淡定自若。 他的…

“我今年 31 岁,工作 7 年,明年退休...”

凌晨 1:30 的北京,商务楼静静地伫立着,街道上的车水马龙,慢慢地停歇了,只有他的工作台灯还没有休息,台灯忽明忽暗地坚持着。凌晨 2:00 的闹钟忍不住提醒他,电脑也偷偷跳出窗口:“主人&#xff0…

据说这是双11前互联网人的一天~

双11前,据说互联网人的一天是这样度过.... 6段故事,6个黑话关键词,生动刻画了双11前互联网人的一天! 上午9点,运营找老板汇报双11方案。 运营说:老板,本次营销方案你看需要一些预算资源支持&a…

快速入门docker容器

文章目录🌲1.拉取一个镜像🌲2. 在docker里启动一个镜像🌲3.查看所有的镜像列表🌲4.删除镜像🌲5.删除全部image镜像🌲6.运行tomcat🌲7.删除所有未运行的容器🌲8.以守护态运行容器&…

不会玩游戏的程序员不是好作家,《深入理解Java虚拟机》周志明来了!

嘉宾:周志明、杨福川采访、撰文:Satoh_AI这次采访起源来自于我和豆瓣的一位读者有同样的好奇心,为什么网上搜不到周志明老师的更多信息?为什么“80后玩家”可以把本本书都维持在9.0分左右?他的“社恐”到底有多严重?所…