深度学习笔记: 最详尽解释混淆矩阵 Confusion Matrix

欢迎收藏Star我的Machine Learning Blog:https://github.com/purepisces/Wenqing-Machine_Learning_Blog。如果收藏star, 有问题可以随时与我交流, 谢谢大家!

混淆矩阵

假设我们有包含临床测量数据的医疗数据,例如胸痛、良好的血液循环、动脉阻塞和体重。我们希望应用机器学习方法来预测某人是否会患上心脏病。

我们可以使用逻辑回归、k最近邻算法、随机森林或其他方法。为了决定哪种方法效果最好,我们首先将数据分为训练集和测试集。请注意,这将是一个使用交叉验证的绝佳机会。我们在训练数据上训练所有方法,并在测试集上测试每种方法,然后用混淆矩阵总结它们的性能。

混淆矩阵的行对应于机器学习算法的预测,而列对应于已知的真实情况。由于有两个类别,对于二分类(“有心脏病”或“没有心脏病”),混淆矩阵看起来像这样:左上角包含真正例(TP),即正确识别的心脏病患者。真正负例(TN)在右下角,即正确识别的无心脏病患者。左下角包含假负例(FN),即被错误识别为无心脏病的心脏病患者。右上角包含假正例(FP),即被错误识别为有心脏病的健康患者。


在这里插入图片描述

  • 真正例 (TP): 正确识别的心脏病患者。
  • 真正负例 (TN): 正确识别的无心脏病患者。
  • 假负例 (FN): 被误分类为健康的心脏病患者。
  • 假正例 (FP): 被误分类为心脏病患者的健康人。

例如,当将随机森林应用于测试数据时,我们得到:

  • 真正例 (TP): 142
  • 真正负例 (TN): 110
  • 假负例 (FN): 29
  • 假正例 (FP): 22

对角线上的数字(绿色框)是正确分类的样本,而非对角线上的数字(红色框)是错误分类的样本。

将随机森林的混淆矩阵与k最近邻算法的混淆矩阵进行比较:

  • 随机森林: TP=142, TN=110
  • k最近邻算法: TP=107, TN=79

由于107 < 142且79 < 110,随机森林的表现更好,因此我们会选择随机森林而不是k最近邻算法。

当应用逻辑回归时,随机森林和逻辑回归的混淆矩阵非常相似,难以选择。我们将在未来讨论更复杂的指标,如敏感性、特异性、ROC和AUC,以帮助做出决定。

多类混淆矩阵

现在,让我们看看一个更复杂的混淆矩阵。

这是一个新的数据集。基于人们对电影《侏罗纪公园III》、《老婆大逃亡》、《Out Kold》和《Howard the Duck》的看法,我们能否使用机器学习方法预测他们最喜欢的电影?

如果最喜欢的电影选项是《Troll 2》、《Gore Police》或《Cool as Ice》,则混淆矩阵将有3行和3列。对角线(绿色框)是机器学习算法做对的地方,其他地方是算法出错的地方。

混淆矩阵的大小取决于预测类别的数量。

  • 2个类别: 2x2混淆矩阵。
  • 3个类别: 3x3混淆矩阵。
  • 4个类别: 4x4混淆矩阵。
  • 40个类别: 40x40混淆矩阵。


在这里插入图片描述

总之,混淆矩阵展示了你的机器学习算法做对和做错的地方。

参考资料:

  • 在YouTube上观看视频
  • 图片来源之一:YouTube视频

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/39136.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

华为机试HJ4字符串分隔

华为机试HJ4字符串分隔 题目&#xff1a; 将输入的字符串分隔为每8个一个新字符串&#xff0c;最有一个不足8个用0来填充。 想法&#xff1a; 遍历提取输入字符串中的每8个字符&#xff0c;填充最后一个不满足长度的字符串&#xff0c;用0填充至8个 input_str input() if…

如何将音频文件发送至摄像头

目前再很多互联互通的场景下&#xff0c;如AI盒子再从摄像头上取视频分析&#xff0c;分析出发生某个事件&#xff0c;需要反向通过摄像头的喇叭播放语音&#xff0c;发出告警提示&#xff0c;使用场景如下 盒子上对于此类场景的需求往往不能满足&#xff0c;或者为这个需求需要…

list对象根据对象属性去重

对List中的对象根据某个属性进行去重的情况。例如&#xff0c;我们有一个实体类student&#xff0c;其中包含属性id、name和age&#xff0c;现在我们有一个List<Student>&#xff0c;我们希望根据name属性去除重复的Student对象。 我们可以借助HashSet的特性&#xff0c;…

APP性能测试

1、性能测试分类&#xff1a;&#xff08;CPU&#xff0c;内存&#xff0c;流量&#xff0c;时间&#xff08;启动耗时计算&#xff09;&#xff0c;电量&#xff0c;流畅度&#xff08;帧率&#xff09;&#xff09;&#xff0c;稳定性&#xff08;崩溃&#xff0c;闪退&#…

感动的短视频:成都柏煜文化传媒有限公司

感动的短视频&#xff1a;瞬间触动心灵的温暖力量 在这个快节奏、高压力的时代&#xff0c;我们常常在忙碌与喧嚣中穿梭&#xff0c;心灵深处那份最纯粹的感动似乎变得愈发珍贵而难得。然而&#xff0c;就在这样一个数字化盛行的今天&#xff0c;短视频以其独特的魅力&#xf…

[答疑]就喜欢把“不变式”叫“固定规则”,不行吗

DDD领域驱动设计批评文集 做强化自测题获得“软件方法建模师”称号 《软件方法》各章合集 &#xff08;匿&#xff09;2024-6-28 15:52 这篇文章把不变式叫做固定规则&#xff0c;被您批评了。我想请教一下什么时候可以用不同的译法&#xff1f;像您的软件方法用涉众&#x…

二百四十二、Hive——Hive的动态分区表出现day=__HIVE_DEFAULT_PARTITION__分区

一、目的 Hive的DWD层动态分区表的分区出现day__HIVE_DEFAULT_PARTITION__&#xff0c;有点懵&#xff0c;而且表中数据的day字段也显示__HIVE_DEFAULT_PARTITION__ 1、DWD层动态分区表的分区 __HIVE_DEFAULT_PARTITION__ 2、DWD层分区字段day数据 __HIVE_DEFAULT_PARTITION…

农业气象监测仪:现代农业的“守护神”

随着科技的不断进步&#xff0c;农业生产也逐渐迈入了智能化的新时代。在众多的农业科技产品中&#xff0c;农业气象监测仪以其独特的优势&#xff0c;成为了现代农业不可或缺的一部分。本文将从多个角度探讨农业气象监测仪在农业中的优势&#xff0c;以及它如何助力农业生产实…

事务的概念-事务的概念、事务的定义(BEGIN TRANSACTION、COMMIT、ROLLBACK)

数据库系统中的事务&#xff0c;是保证系统在发生故障后或存在并发操作的情况下&#xff0c;数据库中的数据与企业业务结果相一致 一、事务的概念 在许多数据库应用系统中&#xff0c;数据库用来存储现实世界中一些企业的状态信息或其管理的数据 1、概念一 &#xff08;1&a…

pdf合并工具,pdf合并器,多个pdf合并成一个pdf

你是否有过这样的困扰&#xff1a;手头上有好几个pdfF文档&#xff0c;需要将它们合并成一个单一的文件&#xff0c;但却不知道从何下手&#xff1f;别担心&#xff0c;这篇文章将为你揭秘多个pdf合并成一个pdf的方法&#xff0c;让你轻松实现pdf文档整合的问题&#xff01; 首…

python 中的 下划线_ 是啥意思

在 Python 中&#xff0c;_&#xff08;下划线&#xff09;通常用作占位符&#xff0c;表示一个变量名&#xff0c;但程序中不会实际使用这个变量的值。 目录 忽略循环变量&#xff1a;忽略函数返回值&#xff1a;在解释器中使用&#xff1a;举例子1. 忽略循环变量2. 忽略不需…

11集在Docker上编译tensorFlow Lite MCU例子工程-《MCU嵌入式AI开发笔记》

【11集在Docker上编译tensorFlow Lite MCU例子工程-《MCU嵌入式AI开发笔记》】 这一集咱们一步一步的在doc下面编译TensorFlow Lite的例程 https://tensorflow.google.cn/lite/tutorials?hlzh-cn 进入这个例子&#xff1a; https://codelabs.developers.google.cn/codelabs/…

使用Java实现智能推荐系统的关键技术

使用Java实现智能推荐系统的关键技术 大家好&#xff0c;我是免费搭建查券返利机器人省钱赚佣金就用微赚淘客系统3.0的小编&#xff0c;也是冬天不穿秋裤&#xff0c;天冷也要风度的程序猿&#xff01;今天我们将深入探讨使用Java实现智能推荐系统的关键技术&#xff0c;这是当…

C# Web控件与数据感应之属性统一设置

目录 关于属性统一设置 准备数据源 范例运行环境 AttributeInducingFieldName 方法 设计与实现 如何根据 ID 查找控件 FindControlEx 方法 调用示例 小结 关于属性统一设置 数据感应也即数据捆绑&#xff0c;是一种动态的&#xff0c;Web控件与数据源之间的交互&…

高编:线程(2)——同步与互斥

一、互斥 概念&#xff1a; 互斥 》在多线程中对 临界资源 的 排他性访问。 互斥机制 》互斥锁 》保证临界资源的访问控制。 pthread_mutex_t mutex; 互斥锁类型 互斥锁变量 内核对象 框架&#xff1a; 定义互斥锁 》初始化锁 》加锁 》解锁 》销…

java 利用 gdal 对shpfile 进行裁剪(一)

简要说明 在java&#xff0c;使用gdal &#xff0c;使用裁剪范围的geojson 对 目标shpfile 进行裁剪&#xff0c;裁剪结果为一份新的shpfile&#xff1b;前置条件是geojson的坐标系和 shpfile 的坐标系一致&#xff0c;不然裁剪结果可能为空。 maven依赖 <!--需要安装完g…

STL的六大组件

一.总体概念 STL&#xff08;Standard Template Library&#xff0c;标准模板库&#xff09;是C标准库的一部分&#xff0c;提供了丰富且高效的数据结构和算法。STL主要由六大组件组成&#xff0c;它们是&#xff1a; 容器&#xff08;Containers&#xff09;&#xff1a;STL提…

ai智能电话机器人的语音识别究竟是如何实现的,机器人部署,识别次数惠

什么是智能语音识别系统&#xff1f;语音识别实际就是将人类说话的内容和意思转化为计算机可读的输入&#xff0c;例如按键、二进制编码或者字符序列等。与说话人的识别不同&#xff0c;后者主要是识别和确认发出语音的人并非其中所包含的内容。语音识别的目的就是让机器人听懂…

RPA自动化实践:发票处理流程自动化

在日常的企业运营中&#xff0c;发票处理是一项繁琐且重复性高的工作。本文将通过一个具体的RPA项目——自动化发票处理流程&#xff0c;展示RPA技术如何提高效率和准确性。 引言 RPA自动化不仅仅是技术的应用&#xff0c;更是一种工作方式的革新。通过自动化发票处理流程&am…

1.(vue3.x+vite)实现卷帘效果

前端技术社区总目录(订阅之前请先查看该博客) 1:效果预览 2:代码编写 <template><div style="width