支持向量机(SVM)算法基本原理skearn实现

1 什么是支持向量机

支持向量机(Support Vector Machine,简称SVM)是一种用来解决二分类问题的机器学习算法,它通过在样本空间中找到一个划分超平面,将不同类别的样本分开,同时使得两个点集(两个点集中的支持向量点) 到此平面的最小距离最大,### 使得两个点集中的边缘点(支持向量点)到此平面的距离最大—从而使其对误差的容忍度最大 ### 。之所以选择距离最大的超平面是因为距离最大的超平面具有最好的泛化性能。

2 支持向量机分类

1)硬间隔支持向量机
#### 两个类别的样本之间存在着清晰的划分超平面 #### ,对于这种清晰线性可分的任务,我们学习一个线性分类器,
也称为硬间隔支持向量机;

2)软间隔支持向量机
当训练数据数据 #### 近似线性 ####可分时,也学习一个线性的分类器,即软间隔支持向量机;硬间隔支持向量机要求所有的样本均被最佳超平面正确划分,而软间隔支持向量机允许某些样本点不满足间隔大于等于1的条件,当然在最大化间隔的时候也要限制不满足间隔大于等于1的样本的个数使之尽可能的少。于是引入一个惩罚系数C>0,并对每个样本点(xi,yi)引入一个松弛变量(slack variables)ξ≥0

3)非线性支持向量机
当训练数据 #### 线性不可分 #### 时,我们可以通过使用 #### 核技巧 #### 及 #### 软间隔 #### 最大化, #### 学习非线性支持向量机。 原始样本空间中不存在一个能正确划分两类样本的超平面的情况,对于这样的问题可以通过将样本从原始空间映射到特征空间使得样本在映射后的特征空间里线性可分。

3 非线性问题(2.2,2.3)的解决方案

将向量进行维度升级:从低维–>到 高维,参数调试:w向量和常量b,最终会得到一个超平面将数据划分。升维的方式即是将线性方程:wx+b=0中的x编程g(x)函数(x为向量),关键问题是如何确定g()函数:

1)g()是无限维的
2)可以不知道无限维映射g(x)的显式表达式,只要知道一个核函数(Kernel Function):
K(x1,x2)=g(x1)的转置 * g(x2)
那么目标函数的优化式仍然可解

3) 常用核函数
a 高斯径向基函数核 Rbf
b 多项式核 Ploy
c Tanh核
d Linear核(线性核)

4 SVM小结

1)小样本方法,样本量比较少的情况下,有比较好的结果。 原因是:只与支持向量有关系
2)SVM天生适合处理二分类问题
3)二分类问题,按照从简单到复杂的程度可以分为:线性可分、近似线性可分、非线性可分、非线性可分也搞不定。
4) 近似线性可分与非线性可分具有本质区别,千万不能把近似线性可分理解为轻微的非线性。近似线性可分,针对的还是线性可分的问题, 只是由于数据集中个别样本的误差或错误,造成线性分割时个别点会分类判别错误,训练的结果得到的是一个线性分类器。 非线性可分,针对的是非线性分类问题,训练结果得到的是一个非线性分类器。
5) 针对具体问题如何选择线性分类、近似线性分类还是非线性分类?这其实是两个问题。 线性分类与近似线性分类不是非此即彼的对立关系,只是对分类准确性要求的程度差异。 惩罚系数 C>0 就反映了对于分类错误的惩罚程度,C值越大表示对于分类准确性的要求越高,C取无穷大就意味着要求严格线性可分、没有错误分类。选择线性分类模型,如果对训练样本或检验样本进行分类判断的错误率很高(score 低),就要考虑使用非线性模型进行分类了。
6)核函数的选择,这是一个非常复杂而且没有标准答案的问题。SVC() 和 NuSVC() 都提供了核函数 ‘linear’,‘poly’,‘rbf’,‘sigmoid’,‘precomputed’ 可供选择。
7)推荐使用 ‘poly’ 和‘rbf’ 核函数,优先选择 ‘poly’ 多项式核函数。
8)使用 ‘poly’ 核函数时,推荐选择 degree=2、degree=3 分别试试。

5 sklearn api

SVC 和 NuSVC 都可以使用核函数方法实现非线性分类,但参数设置有所区别。
对于多类别分类问题,通过构造多个“one-versus-one”的二值分类器逐次分类。

NuSVC() 类的主要参数:
kernel
{‘linear’, ‘poly’, ‘rbf’, ‘sigmoid’, ‘precomputed’},
default=’rbf’ 设定核函数,
‘linear’:线性核函数,
‘poly’:多项式核函数,
‘rbf’:高斯核函数,
‘sigmoid’:S形核函数,
‘precomputed’:自定义核。
默认值为 ‘rbf’
nu:float, default=0.5 训练错误率的上限,也即支持向量的百分比下限。默认值0.5,取值范围(0,1]。
degree:int, default=3  多项式核函数的次数,默认值为 3。其它核函数时不适用。
gamma:{‘scale’, ‘auto’} or float, default=’scale’  ‘rbf’,‘poly’ 和 ’sigmoid’ 核函数的参数选择方式。
coef0:float, default=0.0  'poly’ 和 ’sigmoid‘ 核函数的参数。
class_weight:dict or ‘balanced’, default=None 特征变量的加权系数。用于为某个特征变量设权重,默认所有特征变量的权重相同。
probabilitybool:default=False 是否启用概率估计。默认值 False:不启用。

NuSVC() 类的参数有两类:
一类是针对模型训练的通用参数,对所有核函数都适用,例如 nu、tol、max_iter;
另一类是针对特定的核函数,只对某种核函数有效,并不适用于其它核函数, 例如 degree 只适用于 'poly’核函数,coef0 只适用于’poly’ 和 ’sigmoid‘ 核函数, 而且在 'poly’ 和 ’sigmoid‘ 核函数中的含义也不相同。

NuSVC() 类的主要方法:

1、 fit(X, y[, sample_weight])  用样本集的数据(X,y)训练 SVM 模型。
2、get_params([deep])  获取模型参数。注意不是指分类模型的系数,而是指kernel,
nu,class_weight等训练的设置参数。
3、decision_function(X)  由SVM模型计算 X 的决策函数值,即样本 X 到分离超平面的距离。注意不是分类判别结果。
4、 predict(X)  用训练好的 SVM 模型预测数据集 X 的分类判别结果,如0/1。
5、score(X,y[,sample_weight])  评价指标,对训练样本集 X 的分类准确度。

6 实例

# skl_SVM_v1b.py
# Demo of nonlinear SVM by scikit-learn
# v1.0b: 线性可分支持向量机模型(SciKitLearn)
# Copyright 2021 YouCans, XUPT
# Crated:2021-05-15import numpy as np
import matplotlib.pyplot as plt
from sklearn.svm import SVC, NuSVC, LinearSVC
from sklearn.datasets import make_moons# 数据准备:生成训练数据集,生成等高线网格数据
X, y = make_moons(n_samples=100, noise=0.1, random_state=27)  # 生成数据集
x0s = np.linspace(-1.5, 2.5, 100)  # 创建等差数列,从 start 到 stop,共 num 个
x1s = np.linspace(-1.0, 1.5, 100)  # start, stop 根据 Moon 数据范围选择确定
x0, x1 = np.meshgrid(x0s, x1s)  # 生成网格点坐标矩阵
Xtest = np.c_[x0.ravel(), x1.ravel()]  # 返回展平的一维数组# SVC 建模,训练和输出
modelSVM1 = SVC(kernel='poly', degree=3, coef0=0.2)  # 'poly' 多项式核函数
modelSVM1.fit(X, y)  # 用样本集 X,y 训练支持向量机 1
yPred1 = modelSVM1.predict(Xtest).reshape(x0.shape)  # 用模型 1 预测分类结果# NuSVC 建模,训练和输出
modelSVM2 = NuSVC(kernel='rbf', gamma='scale', nu=0.1)  # 'rbf' 高斯核函数
modelSVM2.fit(X, y)  # 用样本集 X,y 训练支持向量机 2
yPred2 = modelSVM2.predict(Xtest).reshape(x0.shape)  # 用模型 2 预测分类结果fig, ax = plt.subplots(figsize=(8, 6))
ax.contourf(x0, x1, yPred1, cmap=plt.cm.brg, alpha=0.1)  # 绘制模型1 分类结果
ax.contourf(x0, x1, yPred2, cmap='PuBuGn_r', alpha=0.1)  # 绘制模型2 分类结果
ax.plot(X[:, 0][y == 0], X[:, 1][y == 0], "bo")  # 按分类绘制数据样本点
ax.plot(X[:, 0][y == 1], X[:, 1][y == 1], "r^")  # XUPT
ax.grid(True, which='both')
ax.set_title("Classification of moon data by LinearSVM")
plt.show()# 以上程序分别用SVC()类、NuSVC()类建模,并且使用了不同的核函数。
# 如果使用相同的核函数、模型参数, SVC()类、NuSVC()类的模型训练结果是一致的,但参数、属性和方法的定义存在差异。
# 图中分类结果的差异,不是使用SVC()类、NuSVC()类所导致的,而是使用不同的核函数和模型参数的结果。
# SVC()类、NuSVC()类的参数都有两种,一类是针对模型训练的通用参数,另一类是针对特定的核函数,只对某种核函数有效,并不适用于其它核函数。
# 例如,degree、coef0都是针对多项式核函数的专用参数,nu、gamma则是NuSVC()学习算法的通用参数。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/734634.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

spring三种配置方式总结

1 XML方式配置总结 所有内容写到xml格式配置文件中声明bean通过<bean标签<bean标签包含基本信息&#xff08;id,class&#xff09;和属性信息 <property name value / ref引入外部的properties文件可以通过<context:property-placeholderIoC具体容器实现选择Class…

C#位移运算,位运算

//位运算 与& 或| 非~ 异或^ int x 10; //00001010 int y 5; //00000101 &:逐位进行与运算&#xff1a;1&1 1 1&0 0 0&0 0 int result_and x & y; //0 |:逐位进行或运算&#xff1a…

Python语言例题集(008)

#!/usr/bin/python3 #建立链表类和遍历此链表 class Node(): def init(self,dataNone): self.datadata self.nextNone class LinkedList(): def init(self): self.headNone def printList(self):ptrself.headwhile ptr:print(ptr.data)ptrptr.nextlinkLinkedList() link.he…

使用css结合js实现html文件中的双行混排

此前写过一个使用flex布局实现html文件中的双行混排&#xff0c;但是感觉效果不佳。经过几天思考&#xff0c;我认为双行混排的要点其实是两个&#xff1a; 1、正文和批注的文字大小不同&#xff1b; 2、正文和批注的行距相互配合进行设定。 正文和批注的文字大小及行距都可…

网络层转发分组的过程

分组转发都是基于目的主机所在网络的&#xff0c;这事因为互联网上的网络数远小于主机数&#xff0c;这样可以极大的压缩转发表的大小。当分组到达路由器后&#xff0c;路由器根据目的IP地址的网络地址前缀查找转发表&#xff0c;确定下一跳应当到哪个有路由器。因此&#xff0…

OpenHarmony下musl编译工具链普法

OpenHarmony下musl编译工具链普法 引言 欠的债总是要还的&#xff0c;这不前面欠的关于OpenHarmony下musl相关的还是要还的。这里我对其中的相关知识点&#xff0c;梳理&#xff0c;归纳重新消化下&#xff01; 一.GCC/Clang/LLVM的区别与联系 说实话&#xff0c;这块我现在都…

【C语言】深入理解指针(扩展)

一、回调函数是什么 回调函数就是一个通过函数指针调用的函数。 如果你把函数的指针&#xff08;地址&#xff09;做为参数传递给另一个函数&#xff0c;当这个歌指针被用来调用其所指向的函数时&#xff0c;被调用的函数就回调函数。回调函数不是又该函数的实现方直接调用&a…

当量化私募投资总监能学到什么?

我的情况更新 ​我是美国电子工程背景毕业的。在华尔街第一份实习是在E3做手工t0的proprietary trading&#xff0c;被刷下来之后就一直在帮顶级的对冲基金打杂当助理。所以当初决定回国一展身手&#xff0c;并且写下了破百万阅读的&#xff1a; 在私募做量化研究半年能学到什…

3级考题(2)(c++)

#5062. 找和为K的两个元素 题目描述 在一个长度为n&#xff08;n<1000&#xff09;的整数序列中&#xff0c;判断是否存在某两个元素之和为k。 输入格式 第一行输入整数序列的长度n和k&#xff0c;n和k以空格间隔。 第二行输入整数序列中的n个整数&#xff0c;整数以空…

基于神经网络的偏微分方程求解器再度取得突破,北大字节的研究成果入选Nature子刊

目录 一.引言:神经网络与偏微分方程 二.如何基于神经网络求解偏微分方程 1.简要概述 2.基于神经网络求解偏微分方程的三大方向 2.1数据驱动 基于CNN 基于其他网络 2.2物理约束 PINN 基于 PINN 可测量标签数据 2.3物理驱动(纯物理约束) 全连接神经网路(FC-NN) CN…

保姆级讲解字符串函数(下篇)

目录 strtok的使用 strerror的使用 strstr的使用和函数模拟实现 strstr的使用 strstr函数模拟实现 接上篇&#xff1a;保姆级讲解字符串函数&#xff08;上篇&#xff09;&#xff0c;我们接着把剩下三个函数讲解完&#xff0c;继续跟着我的步伐一起学习呀. strtok的使用 …

从 Language Model 到 Chat Application:对话接口的设计与实现

作者&#xff1a;网隐 RTP-LLM 是阿里巴巴大模型预测团队开发的大模型推理加速引擎&#xff0c;作为一个高性能的大模型推理解决方案&#xff0c;它已被广泛应用于阿里内部。本文从对话接口的设计出发&#xff0c;介绍了业界常见方案&#xff0c;并分享了 RTP-LLM 团队在此场景…

ARM中多寄存内存访问概念和栈的种类和应用

多寄存器内存访问指令 多寄存器内存访问指令 MOV R1,#1 MOV R2,#2 MOV R3,#3 MOV R4,#4 MOV R11,#0x40000020 STM R11,{R1-R4} 将R1-R4寄存器中的数据存储到内存以R11为起始地址的内存中 LDM R11,{R6-R9} 将内存中以R11为起始地址的数据读取到R6-R9寄存器中 当寄存器…

Tensorflow2.0+部署(tensorflow/serving)过程备忘记录Windows+Linux

Tensorflow2.0部署&#xff08;tensorflow/serving&#xff09;过程备忘记录 部署思路&#xff1a;采用Tensorflow自带的serving进模型部署&#xff0c;采用容器docker 1.首先安装docker 下载地址&#xff08;下载windows版本&#xff09;&#xff1a;https://desktop.docke…

基于springboot+vue实现早餐店点餐系统项目【项目源码+论文说明】计算机毕业设计

基于springbootvue实现早餐店点餐系统演示 摘要 多姿多彩的世界带来了美好的生活&#xff0c;行业的发展也是形形色色的离不开技术的发展。作为时代进步的发展方面&#xff0c;信息技术至始至终都是成就行业发展的重要秘密。不论何种行业&#xff0c;大到国家、企业&#xff0…

Java 函数式接口

函数式接口 函数式接口是 Java 8 中引入的一个新特性&#xff0c;主要用于支持函数式编程。函数式接口的优点和缺点分别如下&#xff1a; 优点&#xff1a; 简洁性&#xff1a;函数式接口允许使用 Lambda 表达式&#xff0c;使得代码更加简洁和易于理解。Lambda 表达式可以看…

go的singleflight学习

方法 Do DoChan Forget 使用示例 sg "golang.org/x/sync/singleflight"func TestDo(t *testing.T) {var g sg.Groupv, err, _ : g.Do("key", func() (interface{}, error) {return "bar", nil})if got, want : fmt.Sprintf("%v (%T)&quo…

文件操作上(c语言)

目录 1. 文件的作用2. 什么是文件2.1 程序文件2.2 数据文件2.3 文件名 3. 二进制文件和文本文件4. 文件的打开和关闭4.1 流和标准流4.1.1 流4.1.2 标准流 4.2 文件指针4.3 文件的打开与关闭4.3.1 文件的打开模式4.3.2 实例代码 1. 文件的作用 使用文件可以将数据进行持久化的保…

C++ 理解“引用”以及在编程中使用时的注意事项

引言&#xff1a; 在编程中&#xff0c;“引用”是一个变量或者内存地址的别名。它允许我们通过不同的名称来访问同一内存位置。引用的使用可以提高代码的可读性和灵活性&#xff0c;但也带来了一些潜在的问题。在这篇博客中&#xff0c;我们将深入理解引用的概念&#xff0c;并…

openssl调试记录

openssl不能直接解密16进制密文&#xff0c;需要把密文转化成base64格式才能解密 调试记录如下&#xff1a;