python 怎么调用 矩阵 第几行_第58集 python机器学习:混淆矩阵精度指标

混淆矩阵的精度计算公式为:精度=(TP+TN)/(TP+TN+FP+FN),也就是说,精度就是指正确的预测数目除以所有样本的数量。

准确率、召回率与f-分数:总结混淆矩阵还有几种方法,其中最常见的就是准确率和召回率。准确率度量的是被预测为正例的样本有多少是整整的样例。即:准确率=TP/(TP+FP)。如果目标是限制假正例的数量,那么可以使用准确率作为性能目标。

召回率:召回率(recalll)度量的是正类样本中有多少被预测为正类,即:召回率=TP/(TP+FN),如果我们需要找出所有的正类样本,即避免反例是很重要的情况下,那么可以使用召回率作为性能指标。

在优化召回率与优化准确率之间需要折中,如果你预测所有样本都属于正类,那么可以轻松得到完美的召回率(没有假反例、也没有真反例)。但是,将所有样本都预测为正类,将会得得很多假正例,因此准确率会很低。与之相反,如果你的模型只讲一个最确定的数据点预测为正类,其他点都预测为反类,那么准确率将会很完美(假设这个数据点上实际上就属于正类),但是召回率会很差。(当然,准确率和召回率只是度量混淆矩阵情况中两个量,其他的可以根据实际情况取对应的参数)。

f-分数:虽然准确率和召回率是非常重要的度量,三式仅查看二者之一无法提供完美的途径,所以还有一种将两种方法汇总的方法——f-分数。它是准确率与召回率的调和平均,即:F=2*(准确率*召回率)/(准确率+召回率)。

由于f-分数同时考虑了准确率和召回率,所以它对于不平衡的二分类数据集来说是一种比精度更好的度量方式。我们对前面提到过的“9与其余”的数据集的预测结果计算f1-分数(我们这里假设“9”是正类,标记为True,其他样本为False):

from sklearn.metrics import f1_score

print("F1 score most frequent: {:.2f}".format(f1_score(y_test, pred_most_frequent)))

print("F1 score dummy: {:.2f}".format(f1_score(y_test, pred_dummy)))

print("F1 score logreg: {:.2f}".format(f1_score(y_test, pred_logreg)))

print("F1 score of Tree: {:.2f}".format(f1_score(y_test, pred_tree)))

运行后其结果如下:

F1 score most frequent: 0.00

F1 score dummy: 0.13

F1 score logreg: 0.89

F1 score of Tree: 0.55

由运行结果可以看出:most_frequency的预测中得到的是一条错误信息;另外需要注意的是,虚拟预测和决策树预测之间还是有差别的,尽管精度差别不大,但是f-分数却相差很大。在这里,f-分数更加符合我们对模型的直觉。f-分数的缺点则是比精度更加难以解释。

如果我们要对准确率、召回率和f1-分数做一个更加全面的总结,则可以使用classification_report这个函数,它可以同时计算这三个值,并以美观的形式打印出来。

from sklearn.metrics import classification_report

print("Most frequency class precious:")

print(classification_report(y_test, pred_most_frequent, target_names=["not Nine", "Nine"]))

print("Dummy model precious:")

print(classification_report(y_test, pred_dummy, target_names=["not Nine", "Nine"]))

print("Decision tree precious:")

print(classification_report(y_test, pred_tree, target_names=["not Nine", "Nine"]))

print("logistic regression precious")

print(classification_report(y_test, pred_logreg, target_names=["not Nine", "Nine"]))

运行结果如下图

67a7ab17db7c1f01b721b1f4cf040d5a.png

classification_report 属性打印

classification_report函数为每个类别(这里是True和False)生成一行,并给出以该类并为正类的准确率、召回率及f-分数。这里的最后一列support(支持)表示的是在这个类别中真实样本的数量;最后一行显示的是对应指标的加权平均(按每个类别中的样本个数加权)。

同时,我们从运行结果中还可以看出,虚拟模型与logreg之间的区别并不是很明显,选择哪个类作为正类对指标有很大影响。在这里选择Nine作为正类时logisticregression比其他方法更具备优势。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/533456.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

android seekbar闪退,android seekbar 踩坑之路

最近项目中有用到seekbar,之前对这东西不太了解,趁机来踩坑。seekbar样式按我觉得Material 中的还不算难看了。但是美工给了自己的样式,还是得改。主要有这2个属性:android:thumb"drawable/thumb"android:progressDrawable"dr…

华为鸿蒙系统还没发布吗,华为没有孤军奋战,合作伙伴“雪中送炭”,鸿蒙系统正式发布!...

6月2日晚上,期待许久的鸿蒙0S 2终于正式登场了,这意味着鸿蒙手机已经变成了面向市场的正式产品,这是华为迈出的一小步,却是国产系统与安卓、iOS竞争的开始。在鸿蒙OS正式推出后,不少华为手机用户已经收到了系统更新的推…

计算机不能进入桌面,电脑开机无法进入桌面,请高手解决。

该故障是Windows XP操作系统关机故障中最容易出现的故障。造成该故障的原因可能有以下几方面原因:系统设置在添乱Windows XP默认情况下,当系统出现错误时会自动重新启动,这样当用户关机时,如果关机过程中系统出现错误就会重新启动…

幼儿园体育游戏电子计算机教案,【幼儿园体育跳圈圈教案】小班体育教案跳圈圈_小班跳圈圈游戏教案_亲亲宝贝网...

教案二:小兔跳圈活动目标:1、在原地纵跳和短距离双脚连续向前跳的基础上,尝试较长距离双脚连续向前跳圈。2、提高身体的协调能力和弹跳能力。活动准备:1、材料准备:呼啦圈若干、小兔头饰、蘑菇、篮子。2、游戏场地设置…

crtsiii型无砟轨道板_自主知识产权CRTSⅢ型轨道板助力,赣深铁路无砟轨道轨道板灌注第一工作面完成...

(本报河源讯 通讯员 陈前名 杨琰妤)11月29日,伴随着碧源中桥轨道板最后一方自密实混凝土浇筑完成,标志着由中国中铁四局机电公司赣深铁路项目部负责施工的第一工作面无砟轨道工程圆满完成,为实现年底全线轨道板全部灌注的目标奠定了坚实基础。…

聋人工学院计算机老师,聋人工学院12位手语老师用双手传递声音

在全国第十届残运会暨第七届特奥会上有一个特殊的节目,它虽然是舞蹈,但表演者却听不见背景音乐,它虽然需要踩点,但表演者却只能靠记忆与眼睛去完成每一个节拍。70名理工大学聋人工学院的听障同学将克服身体残疾,共同演…

mysql 乘法_测试面试题集Python花式打印九九乘法口诀表

——————今天距2020年28天——————这是ITester软件测试小栈第85次推文面试的时候,面试官可能要求原地秀一段代码,比如小学生都必须会默写的九九乘法口诀表,有长方形格式、左下三角形格式、左上三角形格式、右上三角形格式、以及右下三…

量子计算机怎么编程,量子计算机编程(一)——QPU编程

今天要给大家介绍的是这本书《Programming Quantum Computers —— Essential Algorithms and Code Samples》,主要讲如何在量子计算机上编程,又示例的代码可以跑 https://oreilly-qc.github.io./ ,这本书的理解方向是纯粹计算机的&#xff0…

unity 纹理压缩格式‘_纹理优化:让你的纹理也“瘦”下来

在上一期《纹理优化:不仅仅是一张图片那么简单》中,我们针对纹理相关的优化,挑选了部分知识点分析。无论是大家在开发时的疏忽,还是对相关知识点的理解不足,这些问题的积累最终都会反映到项目的性能表现上。为此&#…

2020中级计算机工程师,2020年上半年中级网络工程师报考详解

原标题:2020年上半年中级网络工程师报考详解软考全称叫做“全国计算机技术与软件专业技术资格(水平)考试”已经开展了十多年了,所受到的欢迎程度也是越来越高,据统计累计参加软考的人数已超300万人,同时每年以21万人的速度持续增加…

华科计算机复试ccf成绩,新鲜速递!刚拟录取华科学妹总结的复试攻略,快看

原标题:新鲜速递!刚拟录取华科学妹总结的复试攻略,快看今天给大家分享一位19考研学妹的面试经验,她报考华中科技大学,已拟录取!复试已落幕,在火车上收到拟录取通知后,感觉自己就像一…

php负载均衡原理_负载均衡的原理(通俗理解)

简单的来说,假设,你在放洗脚水,并且,当前你只有一洗脚盆。那么,你的洗脚水不管有多少,你最多就能装一个洗脚盆的这个就是,单服务器应用场景,你的流量就是洗脚水,然后&…

光影mod_MOD墨设设计丨天海之间的乌托之城

WWW.DINZD.COM“人当诗意地栖居”——海德格尔银湖湾最后一块稀缺资源,陆止于此,海始于斯。也许会在地图上迷失,但是却如仙境般存在,静谧而神圣,神秘而平和。城市展馆 空灵圣洁,隐市秘境天空之尽&#xff0…

逆向查找_「函数说12」数据逆向查找很复杂?match+index让你轻松搞定

EXCEL进阶课堂 函数说 持续更新,这是第12篇教程。欢迎各位小伙伴转发、点赞、讨论,更欢迎私信获取练习素材,刻意练习才能学有收获。第12讲:如何轻松的实现数据逆向查找——matchindex01 问题引入前面给大家介绍vlookup函数后&…

计算机辅助审计的特点是,浅谈新环境下计算机辅助审计的特点和应用_1

浅谈新环境下计算机辅助审计的特点和应用_1 (7页)本资源提供全文预览,点击全文预览即可全文预览,如果喜欢文档就下载吧,查找使用更方便哦!24.90 积分从本学科出发,应着重选对国民经济具有一定实用价值和理论意义的课题。课题具有先…

规培手册填写模板_9年老资料员经验分享,181套资料员模板+302页工作手册,成为优秀资料员还能提高工作效率,限时分享...

一个工程项目中,资料员是不可缺少的,资料员主要负责工程的资料收集、编制和整理等工作内容。一个优秀的资料员价值千金,如何才能成为一个优秀的资料员?今天带来的是在工程中9年资料员的老工编制的资料员工作模板,还有3…

云服务器重装系统后卡顿,云服务器Windows重装系统须知

我们Windows2003/2008/2012中文和英文版本可供安装,安装需注意:1.Windows2003安装后,请通过VNC登录系统设置密码,默认密码为空,否则将无法远程登录!2.Windows2008/2012系统安装后,请尝试使用您设…

dict下如何取值_年薪百万之路--第十七天 装饰器(下)和迭代器

一 有参装饰器>带有参数的函数装饰器为被装饰对象添加认证功能的装饰器,实现的基本形式如下def deco(func):def wrapper(*args,**kwargs):编写基于文件的认证,认证通过则执行resfunc(*args,**kwargs),并返回resreturn wrapper如果想提供多种不同的认证方式以供选…

英雄联盟掉线怎么不显示重新连接服务器,Win7旗舰版系统玩英雄联盟掉线总是显示正在尝试重新连接如何解决...

英雄联盟这款游戏想必大家都非常熟悉吧,然而在玩的过程中总是会碰到一些情况,比如有不少win7旗舰版系统用户在玩英雄联盟的时候,遇到掉线了,总是显示正在尝试重新连接,该怎么办呢,本文就给大家讲解一下Win7…