sklearn svm 调参_sklearn调参（验证曲线，可视化不同参数下交叉验证得分）

一、原始方法：

思路：

1. 参数从 0+∞ 的一个区间取点，方法如： np.logspace(-10, 0, 10) ， np.logspace(-6, -1, 5)

2. 循环调用cross_val_score计算得分。

在SVM不同的惩罚参数C下的模型准确率。

import matplotlib.pyplot as plt

from sklearn.model_selection import cross_val_score

import numpy as np

from sklearn import datasets, svm

digits = datasets.load_digits()

x = digits.data

y = digits.target

vsc = svm.SVC(kernel='linear')

if __name__=='__main__':

c_S = np.logspace(-10, 0, 10)#在范围内取是个对数

# print ("length", len(c_S))

scores = list()

scores_std = list()

for c in c_S:

vsc.C = c

this_scores = cross_val_score(vsc, x, y, n_jobs=4)#多线程 n_jobs，默认三次交叉验证

scores.append(np.mean(this_scores))

scores_std.append(np.std(this_scores))

plt.figure(1, figsize=(4, 3))#绘图

plt.clf()

plt.semilogx(c_S, scores)#划线

plt.semilogx(c_S, np.array(scores)+np.array(scores_std), 'b--')

plt.semilogx(c_S, np.array(scores)-np.array(scores_std), 'b--')

locs, labels = plt.yticks()

plt.yticks(locs, list(map(lambda X: "%g" % X, locs)))#阶段点

plt.ylabel('CV score')

plt.xlabel('parameter C')

plt.ylim(0, 1.1)#范围

plt.show()

效果：

二、高级方法(validation_curve)

思路：

直接用validation_curve获得模型在不同参数下，每次训练得分和测试得分。

from sklearn import svm

from sklearn.model_selection import validation_curve

from sklearn.datasets import load_digits

import numpy as np

import matplotlib.pyplot as plt

digits = load_digits()

X = digits.data

y = digits.target

param_range = np.logspace(-6, -1, 5)

vsc = svm.SVC()

train_score, test_score = validation_curve(vsc, X, y, param_name='gamma', param_range=param_range, cv=10, scoring="accuracy", n_jobs=1)

train_score_mean = np.mean(train_score, axis=1)

train_score_std = np.std(train_score, axis=1)

test_score_mean = np.mean(test_score, axis=1)

test_score_std = np.std(test_score, axis=1)

plt.title("validation curve with SVM")

plt.xlabel("$\gamma%")

plt.ylabel("Score")

plt.ylim()

lw = 2

plt.semilogx(param_range, train_score_mean,label="training score", color="darkorange", lw=lw)

plt.fill_between(param_range, train_score_mean-train_score_std, train_score_mean+train_score_std, alpha=0.2, color="navy", lw=lw)

plt.semilogx(param_range, test_score_mean,label="test score", color="blue", lw=lw)

plt.fill_between(param_range, test_score_mean-test_score_std, test_score_mean+test_score_std, alpha=0.2, color="navy", lw=lw)

plt.legend(loc="best")

plt.show()

结果：

普通交叉验证(OCV)和广义交叉验证(GCV)

普通交叉验证OCV OCV是由Allen(1974)在回归背景下提出的,之后Wahba和Wold(1975)在讨论了确定多项式回归中多项式次数的背景,在光滑样条背景下提出OCV. Craven和Wa ...

机器学习基础：(Python)训练集测试集分割与交叉验证

在上一篇关于Python中的线性回归的文章之后,我想再写一篇关于训练测试分割和交叉验证的文章.在数据科学和数据分析领域中,这两个概念经常被用作防止或最小化过度拟合的工具.我会解释当使用统计模型时,通常 ...

Spark2&period;0机器学习系列之2：基于Pipeline、交叉验证、ParamMap的模型选择和超参数调优

Spark中的CrossValidation Spark中采用是k折交叉验证 (k-fold cross validation).举个例子,例如10折交叉验证(10-fold cross valida ...

python 机器学习中模型评估和调参

在做数据处理时,需要用到不同的手法,如特征标准化,主成分分析,等等会重复用到某些参数,sklearn中提供了管道,可以一次性的解决该问题先展示先通常的做法 import pandas as pd f ...

k-近邻算法采用for循环调参方法

//2019.08.02下午#机器学习算法中的超参数与模型参数1.超参数:是指机器学习算法运行之前需要指定的参数,是指对于不同机器学习算法属性的决定参数.通常来说,人们所说的调参就是指调节超参数.2. ...

sklearn交叉验证-【老鱼学sklearn】

交叉验证(Cross validation),有时亦称循环估计, 是一种统计学上将数据样本切割成较小子集的实用方法.于是可以先在一个子集上做分析, 而其它子集则用来做后续对此分析的确认及验证. 一开始 ...

GridsearchCV调参

在利用gridseachcv进行调参时,其中关于scoring可以填的参数在SKlearn中没有写清楚,就自己找了下,具体如下: parameters = {'eps':[0.3,0.4,0.5,0. ...

LSTM调参经验

0.开始训练之前先要做些什么? 在开始调参之前,需要确定方向,所谓方向就是确定了之后,在调参过程中不再更改 1.根据任务需求,结合数据,确定网络结构. 例如对于RNN而言,你的数据是变长还是非变长:输 ...

Python中Gradient Boosting Machine(GBM)调参方法详解

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/news/521711.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

sklearn svm 调参_sklearn调参（验证曲线，可视化不同参数下交叉验证得分）

相关文章

php json获取get请求,PHP简单的Curl的Get请求和Curl的Post请求和file_get_contents的Get请求获取接口JSON数据...

聊聊代码整洁之道

负载均衡SLB新功能介绍

架构师必备技能：教你画出一张合格的技术架构图

ios键盘done中文_IOS_IOS关闭键盘的方法，首先输入完成后按键盘上的done - phpStudy...

php 显示对像编码,PHP面向对象之旅：类型提示

java.net.SocketException: 权限不够

人工智能让边缘计算更有价值!

硬件测试工程师之EMC项目-电磁干扰-谐波测试的引文

儿童节，5岁宝宝写给程序员爸爸的一封信！萌翻了！

外部jar包_大数据系列之PySpark读写外部数据库

Vue + Spring Boot 项目实战（二）：使用 CLI 搭建 Vue.js 项目

人工智能与大数据的完美结合

这本销量突破70W+的 Python 插画式书籍，凭什么这么火？

【人脸识别终结者】多伦多大学反人脸识别，身份欺骗成功率达99.5%

快速运行python虚拟环境_快速入门Python 最新最流行的pipenv虚拟环境

php中$stu_by,PHP基础案例二：计算学生年龄

1273 - Unknown collation: 'utf8mb4_0900_ai_ci'

iPhone11首批用户评价实属翻车现场；据悉，谷歌宣布投资30亿欧元扩大欧洲数据中心……...

阿里七层流量入口 Tengine硬件加速探索之路