SKLEARN模型选择

数据集划分方法

在这里插入图片描述

K折交叉验证法

  1. 将全部训练集S分成k个不相交的子集,假设S中的训练样例子数为m,那么每一个子集有m/k个训练样例,相应子集称作{s1,s2……sk}
  2. 每次从分好的子集里面,拿一个作为测试集,其他k-1作为训练集
  3. 在k-1个训练集中训练出学习器模型
  4. 把这个模型放到测试集上,得到分类率
  5. 计算k次求得的分类率的平均值,作为改模型或者假设函数的真实分类率
  6. 这个方法充分利用了所有样本,但计算比较繁琐,需要训练k次,测试k次
    在这里插入图片描述

留一法

假设有N个样本,将每一个样本作为测试样本,其它N-1个样本作为训练样本,这样得到N个分类器,N个测试结果。用这N个结果的平均值来测量模型的性能
如果LOD与K-fold—CV比较,LOD在N个样本上建立N个模型而不是k个,更进一步,N个模型的每一个都是在N-1个样本上训练的,而不是(k-1)n/k。两种方法中,假定k不是很大,且k<<N.LOD比k-fold-cv更加耗时
留p法验证
有N个样本,将每p个样本作为测试样本,其它N-p个样本作为训练样本,这样得到(n p)个分类器,不像其他p>1,会发生数据重叠。

随机划分法

Shuffle Split迭代器 产生指定数量 独立的train/test数据集划分。首先对样本全体随机打乱,然后再划分train/test对
可以使得随机种子random_test来控制随机数序列产生器是的运算结果可重现
Shuffle Split是Kfold交叉验证的比较好的替代,它允许更好的控制迭代次数和train/test样本比例
StratifiedShuffle Split 是Shuffle Split的一个变体,返回分层划分,也就是在创建划分的时候要保证每个划分中类的样本比例与整体数据集中的原始比例保持一致
在这里插入图片描述

超参数优化方法

学习器模型中一般有两个参数:一类参数可以从数据中学习可以估计得到,还有一类参数无法从数据中估计,只能靠人的经验进行设计指定。后一类参数叫超参数
比如:支持向量机中C Kernel gama 朴素贝叶斯里的alpha等
在学习器模型设计中,我们要搜索超参数空间的学习器模型找到最合理的超参数
通过此方法获得学习器模型参数列表和当前取值:
estimator.get_params().
在这里插入图片描述
有些学习器模型有自己的独特的参数优化方法
SKLEARN提供两种参数优化方法:网络搜索与随机采样
网格搜索交叉验证:以穷举方式遍历所有可能的参数组合
随机采样交叉验证:依据某种分布对参数空间采样,随机得到一些参数组合方案
在这里插入图片描述

网格式搜索超参数优化方法

在这里插入图片描述
在这里插入图片描述

随机采样式超参数优化方法

在这里插入图片描述
在这里插入图片描述

超参数空间搜索技巧

技巧一:指定一个合适的目标测度对模型进行评估
默认情况下,参数搜索使用estimator的score函数来评估模型在某种参数配置下的性能
分类器对应于:sklearn.metrics.accuracy_score
回归器对应于sklearn.metrics.r2_score
但是在某些应用中,其他评分函数或许更加的合适。(比如,在非平衡的分类问题中,准确率accuracy_score通常不管用。这时我们可以通过参数scoring来指定GridSearchCV类或者RandomizedSearchCV类内部我们自己定义评分函数
技巧二:
使用sklearn的PipLine将estimator和他们的参数空间组合起来
技巧三:
合理划分数据集,开发集(用于GridSearchCV)+测试集(Test)使用model_selection.train_test_split()
技巧四:
并行化(GridSearchCV)和(RandomizedSearchCV)在参数点的计算上可以做到并行运算,用n_jobs来指定
技巧五:
提高到某些参数节点发生错误的鲁棒性:再出错节点提示警告,设置参数error_score=0搞定

模型验证方法

在这里插入图片描述

1.交叉验证计算得分

在这里插入图片描述

2.每个输入数据点交叉验证估计

在这里插入图片描述

3计算并绘制模型的学习率曲线

学习率曲线:
计算指定的学习器模型在不同大小的训练集上经过交叉验证的训练得分和测试得分
首先,用一个交叉验证生成器划分整体数据集k次,每一次划分都有一个训练集和测试集,然后从第k次的训练集中拿出若干个数量不断增加的子集,在这些子训练集上训练模型,然后再计算模型在对应的子训练集和测试集上的得分。最后,对于每种子训练集大小下,将k次训练得分和测试集得分分别进行平均
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

sklearn模型预测性能的评估方法

estimator对象的score方法

在这里插入图片描述

交叉验证中使用scoring参数

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/467741.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

SpringBoot(十) :邮件服务

原文出处&#xff1a; 纯洁的微笑 springboot仍然在狂速发展&#xff0c;才五个多月没有关注&#xff0c;现在看官网已经到1.5.3.RELEASE版本了。准备慢慢在写写springboot相关的文章&#xff0c;本篇文章使用springboot最新版本1.5.3进行开发。 发送邮件应该是网站的必备功能之…

python中order函数_order by排序

作者Toby&#xff0c;持牌照消费金融模型经理&#xff0c;发明国家算法专利,国内最大医药数据中心数据挖掘部门负责人&#xff01;和重庆儿科医院&#xff0c;中科院教授&#xff0c;赛柏蓝保持慢病数据挖掘项目合作&#xff01;清华大学&#xff0c;百度&#xff0c;腾讯&…

被该死的Openssl编译嘲讽了一个下午

昨晚比较尴尬&#xff0c;下班的时候已经很晚了&#xff0c;到半路突然想起来没有带钥匙回去&#xff0c;赶紧折返回公司拿钥匙&#xff0c;在已经很晚的路上我们又多花费了20分钟&#xff0c;到家已经挺晚了&#xff0c;具体多少点我都不好意思说&#xff0c;我要是说出来&…

JavaScript中本地对象、内置对象和宿主对象

http://www.jianshu.com/p/a52e6e183427 http://blog.csdn.net/weiyastory/article/details/52837466 http://www.cnblogs.com/qigang/p/3520974.html 在ECMAScript中&#xff0c;所有对象并非同等创建的。 一般来说&#xff0c;可以创建并使用的对象有3种&#xff1a;本地对象…

类的真正形态

类的真正形态 类的关键字 struct在C语言中已经有了自己的定义&#xff0c;必须继续兼容 在C中提供了新的关键字&#xff0c;class用于类定义 class和struct用法是完全相同 struct和class区别 用struct定义时&#xff0c;所有成员默认为public 用class定义时&#xff0c;所…

docker代理设置ssl证书_docker - 设置HTTP/HTTPS 代理

1、设置代理原因因公司安全限制&#xff0c;所有外网需配置代理后才可上网&#xff0c;但是因为宿主机上设置过代理&#xff0c;并未太过多注意此问题&#xff0c;之后run时报如下错误&#xff1a;# docker run hello-worldUnable to find image hello-world:latest locallydoc…

暴力修改SElinux权限

平台版本 SDK版本 版本名称 9.0 28 Pie (Android P) 8.1 27 Oreo(Android O)&#xff08;奥利奥&#xff09; 8.0 26 Oreo(Android O)&#xff08;奥利奥&#xff09; 7.1 25 Nougat(Android N)&#xff08;牛轧糖&#xff09; 7.0 24 Nougat(Android N)&#xff08;牛轧糖&…

分类器

sklearn分类器性能指标 分类器性能评估指标 只限于二元单元标签分类问题 可用于二元多标签分类问题的评估指标 如何将二元分类指标扩展到多类或多标签问题中去 可用于多类分类问题的评估指标(紫色的可用于多标签问题&#xff09; accuracy_score准确率 函数计算分类…

Cucumber+Rest Assured快速搭建api自动化测试平台

转载&#xff1a;http://www.jianshu.com/p/6249f9a9e9c4 什么是Cucumber&#xff1f;什么是BDD&#xff1f;这里不细讲&#xff0c;不懂的直接查看官方&#xff1a;https://cucumber.io/  什么是Rest Assured&#xff1f;传送门&#xff1a;https://github.com/rest-assured…

毕业设计论文选题系统系统用例图_基于UML的毕业设计管理系统的分析与设计

基于UML的毕业设计管理系统的分析与设计毕业设计是实现本科教学培养目标的重要环节&#xff0c;从选题到答辩一般需要四至六个月的时间&#xff0c;其间工作量很大&#xff0c;尤其需要保留大量的文件&#xff0c;以便于管理者对毕业设计工作进行监督。传统的、人工的方式管理各…

让这个该死的服务跑起来了~

#前言被该死的Openssl编译嘲讽了一个下午之前的文章说了我的那个编译的问题&#xff0c;这里说下&#xff0c;知识点有点零散&#xff0c;最后的解决也是一个同事提示&#xff0c;感觉也有点奇葩的赶脚。到目前为止&#xff0c;我现在感受到了写文章的好处&#xff0c;昨晚的问…

深度学习概述

深度学习 传统学习与深度学习 深度学习应用特点 深度学习框架比较 Tensorflow 神经元 卷积核 分类 回归 生成

Python--递归

面向函数编程 def func():print(从前有座山&#xff0c;山里有座庙&#xff0c;庙里有个老和尚讲故事&#xff0c;讲的什么呀&#xff1f;)func() 解耦&#xff1a;尽量把不相关的功能拆开&#xff0c;用的时候再调用函数&#xff0c;增强代码重用性&#xff0c;减少代码变更的…

python相关知识介绍一种理财方法_我是如何使用python来确定理财策略的

老婆在朋友圈里看到了一条理财广告&#xff0c;一条很让人心动的广告&#xff0c;长下面这个样子。这是香港某保险公司的理财方案&#xff0c;大意是每年定投6.65万&#xff0c;投资5年&#xff0c;总共投资33万的样子&#xff0c;那么第10年&#xff0c;你将可以拿到38.6万&am…

传统神经网络

文章目录神经网络的起源&#xff1a;线性回归一个线性回归问题线性回归优化方法&#xff1a;梯度下降梯度计算梯度计算总结线性回归&#xff1a;输出线性回归&#xff1a;局限从线性到非线性非线性激励常用的非线性激励函数tanhRELULecky RELU神经元—神经网络神经网络构建神经…

[BZOJ1669][Usaco2006 Oct]Hungry Cows饥饿的奶牛

1669: [Usaco2006 Oct]Hungry Cows饥饿的奶牛 Time Limit: 5 Sec Memory Limit: 64 MB Submit: 1000 Solved: 655 [Submit][Status][Discuss]Description Farmer John养了N(1 < N < 5,000)头奶牛&#xff0c;每头牛都有一个不超过32位二进制数的正整数编号。FJ希望奶牛…

vue抽屉_VUE组件 之 Drawer 抽屉

{{ title }}Xprops: {//是否打开display: {type: Boolean},//标题title: {type: String,default: 标题},//是否显示关闭按钮closable: {type: Boolean,default: true},//是否显示遮罩mask: {type: Boolean,default: true},//是否点击遮罩关闭maskClosable: {type: Boolean,defa…

深度学习之卷积神经网络

文章目录深度学习之卷积神经网络链式反向梯度链式法则的计算神经网络中链式法则实例二、卷积神经网络-卷积层&#xff08;一&#xff09;什么是卷积层&#xff08;二&#xff09;有什么组成受什么影响&#xff0c;有何特点卷积网络正向传播反向传播卷积和神经网络功能层深度学习…

datatype未定义是什么意思_vue.js一直提示未定义

.sum_price);}temp_status 1;}else{for(var i0;ivm.list.status 0;}vm.total_price 0;temp_status 0;}//更新数据库api.ajax({url: update_allcart_status_url,method: post,timeout: 30,dataType: json,returnAll: false,data: {values: {token: $api.getStorage(token),d…

卷积神经网络高级篇

【 文章目录Alextnet参数计算VGG alexnet增强版VGG参数计算VGG作用GoogleNet 多分辨率融合全卷积神经网络RESNET结构特性有效性结构化图片特殊处理识别效果全局部卷积网络缺陷U-net图片生成网络VGG u-netAlextnet 参数计算 VGG alexnet增强版 VGG参数计算 VGG作用 GoogleNet 多…