机器学习实验三:支持向量机模型

系列文章目录

  1. 机器学习实验一:线性回归
  2. 机器学习实验二:决策树模型
  3. 机器学习实验三:支持向量机模型
  4. 机器学习实验四:贝叶斯分类器
  5. 机器学习实验五:集成学习
  6. 机器学习实验六:聚类

文章目录

  • 系列文章目录
  • 一、实验目的
  • 二、实验原理
  • 三、实验内容
  • 四、实验步骤
    • 1. 训练集和测试数据集划分
    • 2. 评价分类结果 TP、FN、FP、TN 以及精确率和召回率
    • 3. 加入松弛因子后,与未加松弛因子之前效果做对比。
  • 五、代码参考
  • 总结


一、实验目的

(1)了解支持向量机基本知识;
(2)掌握 SVM 分类器的设计方法;
(3)学会建立 SVM 分类器来实现分类预测,并进行结果分析。

二、实验原理

支持向量机旨在求一个分离超平面。这个超平面使得离它最近的点能够最远。

三、实验内容

使用 Python 读取数据集信息, 使用鸢尾花的花萼(sepal)和花瓣(petal)
的长和宽数据,并利用 sklearn 训练支持向量机模型,随后使用 SVM 实现分类预
测,判断样本属于山鸢尾(Iris Setosa)、变色鸢尾(Iris Versicolor)还是
维吉尼亚鸢尾(Iris Virginica)。评价分类结果 TP、FN、FP、TN 以及精确率和
召回率。
加入松弛因子后,与未加松弛因子之前效果做对比。

四、实验步骤

1. 训练集和测试数据集划分

导入鸢尾花数据集,将数据集按 80%训练集,20%测试集的比例进行分割。

2. 评价分类结果 TP、FN、FP、TN 以及精确率和召回率

FN:被判定为负样本,但事实上是正样本;
FP:被判定为正样本,但事实上是负样本;
TN:被判定为负样本,事实上也是负样本;
TP:被判定为正样本,事实上也是正样本;
精确率 Precision:针对模型判断出的所有正例(即 TP + FP)而言,其中真
正例 TP 占的比例。
Precision = TP /( TP + FP )
召回率 Recall:针对数据集中的所有正例(即 TP + FN)而言,模型正确判
断出的正例 TP 占数据集中所有正例的比例,FN 表示被模型误认为是负例但实
际是正例的数据。
Recall = TP/( TP + FN )

3. 加入松弛因子后,与未加松弛因子之前效果做对比。

假设样本数为 n,原先对样本的分类是yi( 𝑤 ⋅ 𝑥𝑖 + b) ≥ 1 ( i = 1, 2, … ,
n ),则引入松弛因子 ξ ≥ 0后对样本分类的要求变为 yi
( 𝑤 ⋅ 𝑥𝑖 + b) ≥ 1 − 𝜉𝑖 ( i
= 1, 2, …, n ),松弛因子的意义是引入一定的容错性。

五、代码参考

import numpy as np
from sklearn import svm, datasets
from sklearn.model_selection import train_test_split
from sklearn.multiclass import OneVsRestClassifier
from sklearn.preprocessing import label_binarize
iris = datasets.load_iris()
X = iris.data
y = iris.target
random_state = np.random.RandomState(0)
n_samples, n_features = X.shape
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=.2, random_state=66)
# 设定参数
classifier = OneVsRestClassifier(svm.SVC(C=100000, kernel='linear', probability=True, 
random_state=random_state))
classifier.fit(X_train, y_train)
y_pred = classifier.predict(X_test)
def func(precited, expected):res = (precited ^ expected) r = np.bincount(res)tp_list = (precited & expected)fp_list = (precited & (~expected))tp_list = tp_list.tolist()fp_list = fp_list.tolist()TP = tp_list.count(1)FP = fp_list.count(1)TN = r[0] - TPFN = r[1] - FPRecall = TP / (TP + FN)Precesion = TP / (TP + FP)return TP, FP, TN, FN, Recall, Precesion
y_test1 = label_binarize(y_test, classes=[0, 1, 2])
y_pred1 = label_binarize(y_pred, classes=[0, 1, 2])
print(y_pred1[..., 0], y_test1[..., 0])
tp, fp, tn, fn, recall, pre = func(y_pred1[..., 0], y_test1[..., 0])
recall = format(recall, '0.2f')
pre = format(pre, '0.2f')
print(f"type1:recall = {recall} precision ={pre}")
tp, fp, tn, fn, recall, pre = func(y_pred1[..., 1], y_test1[..., 1])
recall = format(recall, '0.2f')
pre = format(pre, '0.2f')
print(f"type2:recall = {recall} precision = {pre}")
tp, fp, tn, fn, recall, pre = func(y_pred1[..., 2], y_test1[..., 2])
recall = format(recall, '0.2f')
pre = format(pre, '0.2f')
print(f"type3:recall = {recall} precision = {pre}")

修改松弛因子
即修改如下语句中的参数 C
classifier = OneVsRestClassifier(svm.SVC(C=100, kernel=‘linear’, probability=True,
random_state=random_state)

总结

以上就是今天要讲的内容,机器学习实验三:支持向量机模型

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/200604.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

深入理解Java中高级使用方式四舍五入

引言 在Java编程中,四舍五入是一个常见的数学运算需求。虽然我们熟悉基础的Math.round()方法,但在一些特殊场景下,比如金融计算或精度要求较高的情况下,我们需要更深入地理解Java中的高级使用方式。本文将深入探讨使用BigDecimal…

CFS三层靶机内网渗透

CFS三层靶机内网渗透 一、靶场搭建1.基础参数信息2.靶场搭建2.1网卡配置2.2Target1配置2.2.1 网卡配置2.2.2 Target1 BT配置 2.3Target2配置2.3.1 网卡配置2.3.2 Target2 BT配置 2.4Target3配置 二、内网渗透Target11.1信息收集1.1.1IP收集1.1.2端口收集1.1.3目录收集 1.2 webs…

SQL错题集2

1.插入记录 用户1001在2021年9月1日晚上10点11分12秒开始作答试卷9001,并在50分钟后提交,得了90分; 用户1002在2021年9月4日上午7点1分2秒开始作答试卷9002,并在10分钟后退出了平台。 2.请把exam_record表中2021年9月1日之前开始作…

连接池 Druid (二) - 连接回收 DestroyThread

接上一篇文章,研究Druid连接池的连接回收线程DestroyThread,通过调用destroyTask.run->DruidDataSourcek.shrink完成过期连接的回收。 DruidDataSourcek.shrink 理解DruidDataSourcek的连接回收方法shrink有一个必要前提:Druid的getConn…

离散数学-函数

1、函数的概念 1&#xff09;函数定义 定义&#xff1a;设 x &#xff0c; y是集合&#xff0c;f是x到y的二元关系&#xff0c;若对每个x属于X&#xff0c;都有唯一的y属于Y&#xff0c;使得<x,y>属于f&#xff0c;则称f是x到y的函数或映射&#xff0c;记作&#xff1a…

在vscode编辑器中,vetur和volar冲突

在vscode编辑器中 vetur插件会把vue3项目当成vue2去检查&#xff0c;然后出现了eslint报错 在项目的 package.json 中添加以下代码&#xff0c;并重启编辑器就可以了 // package.json"eslintConfig": {"rules": {"vue/no-multiple-template-root&qu…

深入理解CopyOnWriteArrayList源码分析

上篇推荐&#xff1a;Java中快速失败 (fail-fast) 机制 CopyOnWriteArrayList简介 CopyOnWriteArrayList是java.util.concurrent包下提供的一个线程安全的ArrayList。它通过一个简单的策略来保证线程安全&#xff1a;当我们需要修改列表时&#xff08;增加、删除、修改等操作&…

102 cesium 切换底图为黑色

1.切换cesium底图为黑色 // 底图const baseLayer viewer.imageryLayers.get(0);if (baseLayer.show) {baseLayer.show false;viewer.scene.globe.baseColor Cesium.Color.BLACK;} else {baseLayer.show true;} 2.地下模式 async toggleUnderground(item: any) {item.activ…

电子学会C/C++编程等级考试2023年03月(四级)真题解析

C/C++等级考试(1~8级)全部真题・点这里 第1题:最佳路径 如下所示的由正整数数字构成的三角形: 7 3 8 8 1 0 2 7 4 4 4 5 2 6 5 从三角形的顶部到底部有很多条不同的路径。对于每条路径,把路径上面的数加起来可以得到一个和,和最大的路径称为最佳路径。你的任务就是求出最…

Linux之重谈文件和c语言文件接口

重谈文件 文件 内容 属性, 所有对文件的操作都是: a.对内容操作 b.对属性操作 关于文件 一&#xff1a; 即使文件的内容为空&#xff0c;该文件也会在磁盘上也会占空间&#xff0c;因为文件不仅仅只有内容还有文件对应的属性&#xff0c;文件的内容会占用空间, 文件的属性也…

gitlab 迁移-安装-还原

文章目录 一、备份原有Gitlab1、备份清单2、备份执行 二、卸载删除原有Gitlab1、停止Gitlab2、卸载Gitlab3、查看Gitlab进程4、杀死进程5、删除所有包含Gitlab文件 三、安装Gitlab1、添加镜像地址2、安装依赖3、安装防火墙4、下载安装Gitlab5、配置Gitlab6、启动并访问 四、还原…

Linux基本指令(2.0)

周边知识&#xff1a; 1.Linux中&#xff0c; 一切皆文件 构建大文件 输入如下shell命令 i1; while [ $i -le 10000]; do echo "hello Linux $i"; let i; done 此时大文件已经创建在big.txt 此时我们发现cat查看无法查看开始内容 我们使用more 当占满一屏之后就不…

Unity-Shader - 2DSprite描边效果

实现一个简单的2D精灵图描边效果&#xff0c;效果如下 实现思路&#xff1a; 可以通过判断该像素周围是否有透明度为 0的值&#xff0c;如果有&#xff0c;则说明该像素位于边缘。 所以我们需要打开alpha blend&#xff0c;即&#xff1a; Blend SrcAlpha OneMinusSrcAlpha&am…

单实例应用程序

2023年12月6日&#xff0c;周三凌晨 什么是单实例应用程序 单实例应用程序可以确保在同一时间只有一个应用程序实例在运行。 通常情况下&#xff0c;当用户尝试再次启动一个已经启动过的应用程序时&#xff0c;操作系统会打开一个新的实例。但有些情况下&#xff0c;我们可能…

js中的栈(stack)和堆(heap)

什么是堆什么是栈&#xff1f; 程序运行时候&#xff0c;需要内存空间存放数据。系统划分出的两种内存空间就叫做stack&#xff08;栈&#xff09;和heap&#xff08;堆&#xff09;。 栈&#xff08;stack&#xff09;&#xff1a;由操作系统自动分配内存空间&#xff0c;自…

透明度值和注意点

透明度 透明度分为256阶&#xff08;0-255&#xff09;&#xff0c;计算机上用16进制表示为&#xff08;00-ff&#xff09;。透明就是0阶&#xff0c;不透明就是255阶,如果50%透明就是127阶&#xff08;256的一半当然是128&#xff0c;但因为是从0开始&#xff0c;所以实际上是…

react项目中使用video标签设置自动播放并未及时播放解决

react项目中使用video标签设置autoplay,但是视频不会直接播放&#xff0c;会加载一段时间后才会自动播放。 解决&#xff1a; 手动调用play方法 const videoRef useRef();useEffect(() > { if(videoRef?.current){if(videoRef?.current.paused){videoRef?.current.pla…

leetcode:1422. 分割字符串的最大得分(python3解法)

难度&#xff1a;简单 给你一个由若干 0 和 1 组成的字符串 s &#xff0c;请你计算并返回将该字符串分割成两个 非空 子字符串&#xff08;即 左 子字符串和 右 子字符串&#xff09;所能获得的最大得分。 「分割字符串的得分」为 左 子字符串中 0 的数量加上 右 子字符串中 1…

Android 12.0 Folder文件夹全屏后文件夹图标列表居中时拖拽app到桌面的优化

1.概述 在12.0的系统rom产品开发中,在Launcher3中在目前的产品需求开发中,对于Launcher3中的文件夹Folder的布局UI 进行了定制化的需求要求把Folder修改为全屏,然后在中间显示文件夹图标的列表,这时候如果Folder是全屏的话,如果拖拽文件夹列表中的app图标,只有拖拽 到屏…

html复习

html form表单作用是收集数据提交 input框体控件不在form不适用于表单提交 可编辑性:contenteditable 提示值消失&#xff1a;placeholder&#xff0c;value是初始数据 块标签&#xff1a;单独占有一个空间&#xff0c;独占一行&#xff0c;标签遵循从上到下排列。table、d…