什么是支持向量机(Support vector machine)和其原理

作为机器学习的基础算法,SVM被反复提及,西瓜书、wiki都能查到详细介绍,但是总是觉得还差那么点,于是决定自己总结一下。

一、什么是SVM?

1、解决什么问题?

SVM,最原始的版本是用于最简单的线性二分类问题。当我们被给了一个新的数据点,其形式是一个p-维的向量,我们想知道它应该属于被一个(p-1)-维超平面分开的两半中哪一半。那么我们就想要通过已有数据找到“最有代表性的”超平面。这个超平面就是我们的分类标准。因为我们用到的是超平面而不是曲面,所以这是一个线性的问题。(加入核方法等可以改进为非线性分类)

2、怎么找超平面? 

以下是一个取p=2的示例图,从图里可以看出,有许多超平面可以对数据进行分类。(在二维,超平面就是一条直线,需要确定直线的斜率和截距。)最佳超平面的一个合理选择是代表两个类别之间最大分离度或边际的超平面。因此,我们在选择超平面时,要使它到两侧最近数据点的距离最大。如果存在这样一个超平面,它就被称为最大边际超平面(maximum-margin hyperplane),而它所定义的线性分类器就被称为最大边际分类器(maximum-margin classifier);或者等同于最佳稳定性感知器(the perceptron of optimal stability)。【from wiki】

3、如何定义“最大距离”?

这一步博客 

支持向量机(SVM)——原理篇

里讲的很清晰了,基本也和西瓜书一致,我就不加赘述,简而言之,就是设出超平面的参数方程,代入求距离最近的点(min),再调整参数方程让最近的点距离尽量远(max)。

这种二次规划问题,一眼要用到拉格朗日乘子法求对偶问题,都是很基础的优化方法。

最终得到:

4、为什么叫“支持向量机”?

接下来这段话很简单但是清晰说明了SVM的本质:

 也就是说,最终我们只会考虑支持向量。

定义:距离超平面最近的几个训练样本点使得\alpha_i \neq 0,这几个样本(由向量表示)被称为支持向量。两个异类支持向量到超平面的距离之和为\frac{2}{||\omega||},被称为间隔(margin)。

5、总结

SM,就是把分类问题或者回归问题,转化为基于已知的分类点求一个分类效果最好的分割超平面,进而可以用优化方法求解。

二、一些特殊的优化技巧? 

1、核方法

a. 解决什么问题?

 基础的SVM需要假设所有样本是线性可分的,但是实际任务可能不是,而是需要一个曲面。

对这样的问题,可将样本从原始空间映射到一个更高维的特征空间,使得样本在这个特征空间内线性可分:例如在图6.3中,若将原始的二维空间映射到一个合适的三维空间,就能找到一个合适的划分超平面,幸运的是,如果原始空间是有限维,即属性数有限,那么一定存在一个高维特征空间使样本可分。【引自西瓜书】

b.如何实现?

简单来说,就是找一个映射,把原本的数据\vec{x}映射到\phi(\vec{x}),通过推演我们发现

具体实现细节可以参考西瓜书或者以下博客: 
j​​​​​​​​​​​​​​浅入浅出核方法 (Kernel Method) - 知乎

2、软间隔

a. 解决什么问题?

即使我们用了核方法让原本不是线性可分的数据变得貌似线性可分,我们也不知道是不是过拟合了,缓解方法之一就是允许算法在一些样本上出错、也就是把硬间隔变成软间隔。

那么问题就变成如何让不满足约束的样本尽量少。 

线性SVM之硬间隔和软间隔的直觉和原理 - 知乎

这个讲得还挺清晰的。。。 ​​​​​​​

 

三、支持向量回归

回归问题和分类问题不同,分类是希望样本尽量远离预测的超平面,而回归是希望样本尽量靠近预测的超平面。一般来说就是落入间隔带。 

细节不表。可参考西瓜书。

参考文献:

[1] https://en.wikipedia.org/wiki/Support_vector_machine

[2]《机器学习》周志华

[3]支持向量机(SVM)——原理篇

[4]浅入浅出核方法 (Kernel Method) - 知乎 

[5] 线性SVM之硬间隔和软间隔的直觉和原理 - 知乎

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/717669.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

蓝桥杯备赛第五篇(动态规划)

1.数位dp public class Main {static long[] limit;static int length;static long[][] dp;public static long dfs(int pos, int pre, boolean flag, boolean lead) {if (pos length) return 1;if (!flag && !lead && dp[pos][pre] ! -1) return dp[pos][pr…

总结 HashTable, HashMap, ConcurrentHashMap 之间的区别

1.多线程环境使用哈希表 HashMap 不行,线程不安全 更靠谱的,Hashtable,在关键方法上加了synchronized 后来标准库又引入了一个更好的解决方案;ConcurrentHashMap 2.HashMap 首先HashMap本身线程不安全其次HashMap的key值可以为空(当key为空时,哈希会…

【Java数据结构】——五道算法题让你灵活运用Map和Set

目录 一.只出现一次的数字 二.宝石与石头 三.旧键盘 四.给定一个数组,统计每个元素出现的次数 五.前K个高频单词 一.只出现一次的数字 136. 只出现一次的数字 - 力扣(LeetCode) 算法原理:我们将nums中每个元素都存入到set中…

C/C++嵌入式开发环境搭建,Qt交叉编译,cmake交叉编译,clion/vscode远程开发

目录 交叉编译简介cmake 交叉编译clion 交叉编译vscode 远程嵌入式开发Qt交叉编译1.安装交叉编译工具2.交叉编译qt库3.将交叉编译的Qt库复制到板子上4.安装和配置 Qt Creator,支持交叉编译5.QT嵌入式开发6.QT嵌入式开发报错解决QIconvCodec::convertToUnicode: usin…

ASUS华硕天选5笔记本电脑FX607JV原装出厂Win11系统下载

ASUS TUF Gaming F16 FX607JV天选五原厂Windows11系统 适用型号: FX607JU、FX607JI、FX607JV、 FX607JIR、FX607JVR、FX607JUR 下载链接:https://pan.baidu.com/s/1l963wqxT0q1Idr98ACzynQ?pwd0d46 提取码:0d46 原厂系统自带所有驱动、…

TypeScript中 “ <> “ 语法 和 “ : “ 怎么使用

在 TypeScript 中&#xff0c;尖括号语法(<Type>)和as关键字(value as Type)都是用于类型断言&#xff0c;而冒号(:)用于类型注解。这三种语法在不同的场景下使用&#xff1a; 尖括号语法和as关键字&#xff1a; 尖括号语法(<Type>value)&#xff1a; 这种语法在…

[LeetBook]【学习日记】链表反转

来源于「Krahets」的《图解算法数据结构》 https://leetcode.cn/leetbook/detail/illustration-of-algorithm/ 链表反转的递归要点 递归终止条件为当前节点为空&#xff0c;表明遍历到了链表尾部递归函数传入参数为当前节点的下一个节点按照是否重新开辟存储空间分类下面只写…

python自动化学习--3.8python操作EXCEL文件python日志收集处理

1、Excel文件处理 安装 openpxl 第三方库 openpxl 模块三大组件: 1、工作簿 &#xff08;包含多个sheet工作表&#xff09; 2、工作表 &#xff08;某个数据包含在某个工作表&#xff09; 3、单元格 1、创建excel工作簿 import openpyxl"""Excel表格的创建…

【简说八股】Spring事务失效可能是哪些原因?

Spring事务介绍 Spring事务是指在Spring框架中对数据库操作进行管理的一种机制&#xff0c;它确保一组数据库操作要么完全执行成功&#xff08;提交&#xff09;&#xff0c;要么完全不执行&#xff08;回滚&#xff09;&#xff0c;从而保持数据一致性和完整性。 Spring框架…

GotoXy控制台光标的位置更新

光标控制解释 控制台的光标更新方法, 用于控制数据输出位置 void gotoXY(int x, int y)//新函数&#xff1a;更新光标 {COORD c;c.X x;c.Y y;SetConsoleCursorPosition(GetStdHandle(STD_OUTPUT_HANDLE), c); }代码解释 这段代码定义了一个名为 gotoXY 的函数&#xff0c;…

设计模式-装饰者模式应用实践

装饰者模式&#xff08;Decorator Pattern&#xff09;是一种结构型设计模式&#xff0c;它允许动态地向一个现有的对象添加新的功能&#xff0c;同时不改变其结构。这种模式通过创建一个装饰类来包装原有的类&#xff0c;提供额外的行为。 下面是一个使用 Java 实现装饰者模式…

【Spring Boot】实现全局异常处理

1.定义基础异常接口类 /*** description: 服务接口类* author: MrVK* date: 2021/4/19 21:39*/ public interface BaseErrorInfoInterface {/*** 错误码* return*/String getResultCode();/*** 错误描述* return*/String getResultMsg(); } 2.定义错误处理枚举类 /*** desc…

小伙伴询问AI该怎么学习?本人的一点总结,以思维导图呈现

如有需要思维导图的在后台请留邮箱&#xff0c;相关知识结构目录 部分导图

nn.Linear() 使用提醒

原本以为它是和nn.Conv2d()一样&#xff0c;就看第二个维度的数值&#xff0c;今天才知道&#xff0c;它是只看最后一个维度的数值&#xff01;&#xff01;&#xff01; 例子1 Descripttion: Result: Author: Philo Date: 2024-02-27 14:33:50 LastEditors: Philo LastEditT…

git使用merge命令把dev分支的mian.js文件和src下面的vuex文件夹以及config文件夹单独合并到master分支上

使用 git merge 命令来单独合并特定文件或文件夹到另一个分支通常不是最直接的方法&#xff0c;因为 merge 命令是用来合并两个分支的所有更改的。然而&#xff0c;你可以通过 git cherry-pick 命令或者通过创建临时补丁&#xff08;patch&#xff09;来实现这一点。 下面是一个…

秒杀的时候怎么使用Redis?

商品信息存储&#xff1a;在Redis中存储秒杀商品的库存信息。可以使用Redis的Hash数据类型&#xff0c;将商品ID作为字段&#xff0c;库存数量作为值存储在Hash中。例如&#xff0c;HSET seckill_goods stock_1 100表示商品ID为stock_1的商品库存数量为100。 秒杀订单存储&…

如何使用“Ubuntu 20.04桌面版,安装MariaDB数据库“?win10系统?

1、更新软件包 sudo apt update 2、 安装MariaDB服务器和客户端 sudo apt install mariadb-server mariadb-client 3、 查看MeriaDB是否运行 service mysql status :q"退回命令行状态 4、 设置MariaDB root用户的密码 sudo mysql_secure_installation 5、 MariaD…

斐波那契数列模型----三步问题

面试题 08.01. 三步问题 - 力扣&#xff08;LeetCode&#xff09; 1、状态表示&#xff1a; 题目要求&#xff1a;上到n阶台阶&#xff0c;有多少种方法。那么n逐渐简化&#xff0c;上1阶台阶有多少种方法&#xff1b;上2阶台阶有多少种方法……直到上n阶台阶有多少种方法。 …

c++ [[nodiscard]]关键字详解

如果一个函数声明了[[nodiscard]]&#xff0c;则该函数的返回值不能没有承接&#xff0c;如果没有承接&#xff0c;就会编译报warning [[nodiscard]]是c17新特性&#xff0c;但本地用c11标准编译也能编译过&#xff0c;尚不清楚原因&#xff0c;c20加入了warning后的额外文字描…

代码随想录第45天|● 70. 爬楼梯 (进阶) ● 322. 零钱兑换 ● 279.完全平方数

文章目录 ● 70. 爬楼梯 &#xff08;进阶&#xff09;思路&#xff1a;- 排列 先value后weight代码&#xff1a; ● 322. 零钱兑换思路&#xff1a;代码 ● 279.完全平方数思路&#xff1a;代码 ● 70. 爬楼梯 &#xff08;进阶&#xff09; 思路&#xff1a;- 排列 先value后…