- 支持向量机是一种二类分类模型。
- 基本模型:定义在特征空间上的间隔最大的线性分类器
- 模型升级:线性分类器+核技巧=非线性分类器
- 学习策略:间隔最大化(可形式化为求解凸二次规划的问题;可等价于正则化的合页损失函数的最小化问题)
- 学习算法:求解图二次规划的最优化算法
- 支持向量机的思想:找到几何间隔最大的最优超平面
Q:支持向量机做分类模型需要注意的点?
1. 注意点1
要把sign函数建出来才叫分类模型(区分分类决策函数与分离超平面)
2. 注意点2
求解过程中的两个约束条件 :
由繁至简的模型
1. 线性可分支持向量机
1.1. 概念
定义:当训练数据线性可分时,通过硬间隔最大化,学习一个线性的分类器,即线性可分支持向量机,又称为硬间隔支持向量机。
最大间隔分离超平面的存在性、唯一性:线性可分训练数据集的最大间隔分离超平面是存在且唯一的。
note:当题目让我们求线性可分支持向量机时,要求分离超平面+分类决策函数
支持向量、间隔、间隔边界:
在线性可分情况下,训练数据集的样本点中与分离超平面距离最近的样本点的实例称为支持向量。如图7.