支持向量机(公式推导+举例应用)

文章目录

      • 引言
      • 间隔与支持向量机
      • 对偶问题(拉格朗日乘子法)
      • SMO算法
      • 核函数
      • 软间隔与正则化
        • 软间隔
        • 正则化(罚函数法)
      • 模型的稀疏性
      • 结论
      • 实验分析

引言

在机器学习领域,支持向量机(Support Vector Machine,简称SVM)是一种强大而广泛应用的监督学习算法。其独特的优势在于在高维空间中进行准确分类,并在处理复杂数据集时表现出色。支持向量机的核心思想是在数据点间找到一个最优的超平面,以最大化不同类别之间的间隔,同时最小化分类误差。

SVM的独特之处在于其对非线性关系的处理能力,这得益于其引入了核函数的概念,使得在高维空间中进行非线性映射成为可能。除了在分类问题中的成功应用,支持向量机还被广泛用于回归、异常检测和数据压缩等多个领域。

本博客将深入探讨支持向量机的原理,从数学层面推导其基本公式,并通过实际例子展示其在现实问题中的应用。通过阅读本文,您将更好地理解支持向量机的工作原理以及如何在实际场景中应用这一强大的机器学习算法。

间隔与支持向量机

给定训练样本集 D = { ( x 1 , y 1 ) , ( x 2 , y 2 ) , . . . , ( x m , y m ) } D=\{(x_1,y_1),(x_2,y_2),...,(x_m,y_m) \} D={(x1,y1),(x2,y2),...,(xm,ym)} y i ∈ { − 1 , + 1 } y_i \in \{-1,+1\} yi{1,+1},分类学习最基本想法是基于训练集 D D D在样本空间中找到一个可以划分的超平面,将不同类别的样本分开。但能将训练样本划分开的超平面由很多,如下图所示:
在这里插入图片描述
在之前的线性判别分析(LDA)中,我们可知,所得到的超平面应该使得同类样例的投影点尽可能的接近、异类的样本点尽可能的原理。

线性判别分析(LDA)

在样本空间中,划分超平面可通过如下线性方程来描述:
w T x + b = 0 (1) w^Tx+b=0 \tag{1} wTx+b=0(1)

其中 w = ( w 1 , w 2 , . . . , w d ) T w=(w_1,w_2,...,w_d)^T w=(w1,w2,...,wd)T为法向量,决定了超平面的方向; b b b是位移项,决定了超平面与原点之间的距离。显然,划分超平面可被法向量 w w w和位移 b b b确定。样本空间中任意点 x x x到超平面 ( w , b ) (w,b) (w,b)的 距离可写为:
r = ∣ w T x + b ∣ ∣ ∣ w ∣ ∣ (2) r=\frac{|w^Tx+b|}{||w||} \tag{2} r=∣∣w∣∣wTx+b(2)

假设超平面 ( w , b ) (w,b) (w,b)能将训练样本正确分类,即对于 ( x i , y i ) ∈ D (x_i,y_i)\in D (xi,yi)D,若 y i = + 1 y_i=+1 yi=+1,则有 w T x i + b > 0 w^Tx_i+b>0 wTxi+b>0;若 y i = − 1 y_i=-1 yi=1,则有 w T x i + b < 0 w^Tx_i+b<0 wTxi+b<0。令:
{ w T x i + b ≥ + 1 , y i = + 1 w T x i + b ≤ − 1 , y i = − 1 (3) \begin{cases} w^Tx_i+b\geq+1,\quad y_i=+1\\ w^Tx_i+b\leq-1,\quad y_i=-1 \end{cases} \tag{3} {wTxi+b+1,yi=+1wTxi+b1,yi=1(3)
在这里插入图片描述
由式(2)和(3)可得出对于类别1和类别2距离超平面最近的两个点使得(3)式的等号成立,被称为支持向量,即:
{ w T x i + b = + 1 , y i = + 1 w T x i + b = − 1 , y i = − 1 \begin{cases} w^Tx_i+b=+1,\quad y_i=+1\\ w^Tx_i+b=-1,\quad y_i=-1 \end{cases} {wTxi+b=+1,yi=+1wTxi+b=1,yi=1
将其带入(2)中,得到两个异类支持向量到超平面的距离之和为:

γ = 2 ∣ ∣ w ∣ ∣ (4) \gamma=\frac{2}{||w||} \tag{4} γ=∣∣w∣∣2(4)

Mark:支持向量:距离超平面最近的这几个训练样本点使得式(3)的等号成立。

欲寻找到具有最大间隔的划分超平面,也就是要找到能满足式(3)中约束的参数 w w w b b b,使得 γ \gamma γ最大,即:
max ( w , b ) 2 ∥ w ∥ s.t. y i ( w T x i + b ) ≥ 1 , i = 1 , 2 , … , m (5) \begin{aligned} &\underset{(w, b)}{\text{max}} \quad \frac{2}{\|w\|} \\ &\text{s.t.} \quad y_i(w^Tx_i + b) \geq 1, \quad i = 1, 2, \ldots, m \end{aligned} \tag{5} (w,b)maxw2s.t.yi(wTxi+b)1,i=1,2,,m(5)

显然,若使得 γ \gamma γ最大化,仅需要最大化 ∣ ∣ w ∣ ∣ − 1 ||w||^{-1} ∣∣w1,这就等价于 最小化 ∣ ∣ w ∣ ∣ 2 ||w||^2 ∣∣w2。于是,式(5)可改写为:
max ( w , b ) 1 2 ∣ ∣ w ∣ ∣ 2 s.t. y i ( w T x i + b ) ≥ 1 , i = 1 , 2 , … , m (6) \begin{aligned} &\underset{(w, b)}{\text{max}} \quad \frac{1}{2}||w||^2 \\ &\text{s.t.} \quad y_i(w^Tx_i + b) \geq 1, \quad i = 1, 2, \ldots, m \end{aligned} \tag{6} (w,b)max21∣∣w2s.t.yi(wTxi+b)1,i=1,2,,m(6)
这就是支持向量机(SVM)的基本型。

对偶问题(拉格朗日乘子法)

我们直接对式(6)使用拉格朗日乘子法可得到一个对偶问题,则拉格朗日函数可写为:
L ( w , b , λ ) = 1 2 ∣ ∣ w ∣ ∣ 2 + ∑ i = 1 m λ i ( 1 − y i ( w T x i + b ) ) (7) L(w,b,\lambda)=\frac{1}{2}||w||^2+\sum_{i=1}^m \lambda_i(1-y_i(w^Tx_i + b)) \tag{7} L(w,b,λ)=21∣∣w2+i=1mλi(1yi(wTxi+b))(7)
其中 λ i ≥ 0 \lambda_i\geq0 λi0,令 L ( w , b , λ ) L(w,b,\lambda) L(w,b,λ) w w w b b b λ \lambda λ的偏导为0可得:
{ ∂ L ∂ w = w − ∑ i = 1 m λ i y i x i = 0 ∂ L ∂ b = − ∑ i = 1 m λ i y i = 0 ∂ L ∂ λ = 1 − y i ( w T x i + b ) = 0 \begin{cases} \frac{\partial L}{\partial w}=w-\sum_{i=1}^m\lambda_iy_ix_i=0 \\ \frac{\partial L}{\partial b}=-\sum_{i=1}^m\lambda_iy_i=0 \\ \frac{\partial L}{\partial \lambda}=1-y_i(w^Tx_i + b)=0 \end{cases} wL=wi=1mλiyixi=0bL=i=1mλiyi=0λL=1yi(wTxi+b)=0

整理可得:
w = ∑ i = 1 m λ i y i x i (8) w=\sum_{i=1}^m\lambda_iy_ix_i \tag{8} w=i=1mλiyixi(8)
∑ i = 1 m λ i y i = 0 (9) \sum_{i=1}^m\lambda_iy_i=0 \tag{9} i=1mλiyi=0(9)
y i ( w T x i + b ) = 1 (10) y_i(w^Tx_i + b)=1 \tag{10} yi(wTxi+b)=1(10)

将式(8)和(9)带入式子(7)中可得到式(6)的对偶问题
max λ ∑ i = 1 m λ i − 1 2 ∑ i = 1 m ∑ j = 1 m λ i λ j y i y j x i T x j s.t. ∑ i = 1 m λ i y i = 0 λ i ≥ 0 , i = 1 , 2 , … , m (11) \begin{aligned} &\underset{\lambda}{\text{max}} \quad \sum_{i=1}^m\lambda_i-\frac{1}{2}\sum_{i=1}^m\sum_{j=1}^m\lambda_i\lambda_jy_iy_jx_i^Tx_j \\ &\text{s.t.} \quad \sum_{i=1}^m\lambda_iy_i=0 \\ & \ \ \ \ \ \ \ \ \ \ \lambda_i\geq0, \quad i = 1, 2, \ldots, m \end{aligned} \tag{11} λmaxi=1mλi21i=1mj=1mλiλjyiyjxiTxjs.t.i=1mλiyi=0          λi0,i=1,2,,m(11)

解出 λ \lambda λ后,求出 w w w b b b即可得到模型
f ( x ) = w T x + b = ∑ i = 1 m λ i y i x i T x + b (12) \begin{aligned} f(x)& =w^Tx+b \\ & =\sum_{i=1}^m\lambda_iy_ix_i^Tx+b \end{aligned} \tag{12} f(x)=wTx+b=i=1mλiyixiTx+b(12)

从对偶问题(11)所解出的 λ i \lambda_i λi是式(7)中的拉格朗日乘子,它对应着样本 ( x i , y i ) (x_i,y_i) (xi,yi)。注意到式(6)中有不等式约束条件,故上述式子的推导过程应满足KKT条件即:
{ λ i ≥ 0 y i f ( x i ) − 1 ≥ 0 λ i ( y i f ( x i ) − 1 ) = 0 (13) \begin{cases} \lambda_i\geq0 \\ y_if(x_i)-1\geq0 \\ \lambda_i(y_if(x_i)-1)=0 \end{cases}\tag{13} λi0yif(xi)10λi(yif(xi)1)=0(13)

所以,对于训练样本 ( x i , y i ) (x_i,y_i) (xi,yi),总有 λ i = 1 \lambda_i=1 λi=1 y i f ( x i ) = 1 y_if(x_i)=1 yif(xi)=1

  • λ i = 0 \lambda_i=0 λi=0,则有式(12) f ( x ) = ∑ i = 1 m λ i y i x i T x + b = b f(x)=\sum_{i=1}^m\lambda_iy_ix_i^Tx+b=b f(x)=i=1mλiyixiTx+b=b,即 λ i \lambda_i λi不会对 f ( x ) f(x) f(x)产生任何影响,那么对应的样本不是支持向量,因为它对目标函数没有贡献。
  • λ i > 0 \lambda_i>0 λi>0,则必有 y i f ( x i ) = 1 y_if(x_i)=1 yif(xi)=1,所对应的样本点位于最大间隔边界上,是一个支持向量。

SMO算法

SMO(Sequential Minimal Optimization)是一种用于求解支持向量机的优化算法。它通过将大优化问题分解为多个小优化子问题的方式,每次只优化两个变量,从而简化了问题的求解。
SMO算法步骤:

  1. 选取一对需要更新的变量 λ i \lambda_i λi λ j \lambda_j λj
  2. 固定 λ i \lambda_i λi λ j \lambda_j λj以外的参数,求解式(11)获取更新后的 λ i \lambda_i λi λ j \lambda_j λj

注意到只选取 λ i \lambda_i λi λ j \lambda_j λj中有一个不满足KKT条件,目标函数就会在迭代后增大。直观来看KKT条件违背的程度越大,则变量更新后可能会导致目标函数值增大。故SMO算法采用如下策略来缓解该情况。

  • 先选取违背KKT条件程度最大的变量。
  • 第二个变量选择一个使目标函数值增长最快的变量。

因此SMO算法采取了一个启发式:使选取的两变量所对应样本之间的间隔最大。(每次的更新使得目标函数的优化达到最大值)

  • 直到收敛

SMO算法之所以高效,是由于固定其他参数后,仅优化两个参数的过程能做到非常高效。具体来说,仅考虑 λ i \lambda_i λi λ j \lambda_j λj时,式(11)的约束条件可重写为:
λ i y i + λ j y j = c , λ i ≥ 0 λ j ≥ 0 (14) \lambda_iy_i+\lambda_jy_j=c,\quad \lambda_i\geq0\quad \lambda_j\geq0 \tag{14} λiyi+λjyj=c,λi0λj0(14)
其中
c = − ∑ k ≠ i , j λ k y k (15) c=-\sum_{k\neq i,j} \lambda_ky_k \tag{15} c=k=i,jλkyk(15)
是使 ∑ i = 1 m λ i y i = 0 \sum_{i=1}^m\lambda_iy_i=0 i=1mλiyi=0成立的常数。用式(14) λ j = c − λ i y i y j \lambda_j=\frac{c-\lambda_iy_i}{y_j} λj=yjcλiyi消去式(11)中的变量 λ j \lambda_j λj,最终得到一个关于 λ i \lambda_i λi的单变量二次规划问题,式(11)可变为:
max λ ∑ i = 1 m λ i − 1 2 ∑ i = 1 m ∑ j = 1 m λ i y i ( c − λ i y i ) x i T x j λ i ≥ 0 , i = 1 , 2 , … , m (16) \begin{aligned} &\underset{\lambda}{\text{max}} \quad \sum_{i=1}^m\lambda_i-\frac{1}{2}\sum_{i=1}^m\sum_{j=1}^m\lambda_iy_i(c-\lambda_iy_i)x_i^Tx_j \\ & \ \ \ \ \ \ \ \ \ \ \lambda_i\geq0, \quad i = 1, 2, \ldots, m \end{aligned} \tag{16} λmaxi=1mλi21i=1mj=1mλiyi(cλiyi)xiTxj          λi0,i=1,2,,m(16)
确定偏移项 b b b
注意到对任意支持向量 ( x s , y s ) (x_s,y_s) (xs,ys)都有 y s f ( x s ) = 1 y_sf(x_s)=1 ysf(xs)=1,即:
y s ( ∑ i ∈ S λ i y i x i T x s + b ) = 1 (17) y_s(\sum_{i \in S}\lambda_iy_ix_i^Tx_s+b)=1 \tag{17} ys(iSλiyixiTxs+b)=1(17)
其中由式(12)可知, f ( x s ) = ∑ i = 1 m λ i y i x i T x s + b f(x_s)=\sum_{i=1}^m\lambda_iy_ix_i^Tx_s+b f(xs)=i=1mλiyixiTxs+b S = { i ∣ λ i > 0 , i = 1 , 2 , . . . , m } S=\{i|\lambda_i>0,i=1,2,...,m\} S={iλi>0,i=1,2,...,m}是所有支持向量的下标集。理论上我们可选择任意的支持向量并通过式(17)经行求解从而获得 b b b,但现实任务中常常采用一种更鲁棒性的做法:使用所有支持向量求解的平均值:
b = 1 ∣ S ∣ ∑ s ∈ S ( 1 / y s − ∑ i ∈ S λ i y i x i T x s ) (18) b=\frac{1}{|S|}\sum_{s \in S}(1/y_s-\sum_{i \in S}\lambda_iy_ix_i^Tx_s) \tag{18} b=S1sS(1/ysiSλiyixiTxs)(18)

核函数

核函数是一个能够计算两个输入数据点之间相似度的函数。在 SVM 中,核函数的主要目的是将数据映射到高维空间,而无需显式地计算新空间的坐标。
在这里插入图片描述
例如在上图中,若将原始的二维空间映射到一个合适的三维空间,就能映射到一个合适的三维空间,从而找到一个合适的划分超平面。

ϕ ( x ) \phi(x) ϕ(x)表示将 x x x映射后的特征向量,于是,在特征空间中划分超平面所对应的模型可表示为:
f ( x ) = w T ϕ ( x ) + b (19) f(x)=w^T\phi(x)+b \tag{19} f(x)=wTϕ(x)+b(19)
其中 w w w b b b是模型参数,类似于式(6),有:
max ( w , b ) 1 2 ∣ ∣ w ∣ ∣ 2 s.t. y i ( w T ϕ ( x i ) + b ) ≥ 1 , i = 1 , 2 , … , m (20) \begin{aligned} &\underset{(w, b)}{\text{max}} \quad \frac{1}{2}||w||^2 \\ &\text{s.t.} \quad y_i(w^T\phi(x_i) + b) \geq 1, \quad i = 1, 2, \ldots, m \end{aligned} \tag{20} (w,b)max21∣∣w2s.t.yi(wTϕ(xi)+b)1,i=1,2,,m(20)
其对偶问题是:
max λ ∑ i = 1 m λ i − 1 2 ∑ i = 1 m ∑ j = 1 m λ i λ j y i y j ϕ ( x i ) T ϕ ( x j ) s.t. ∑ i = 1 m λ i y i = 0 λ i ≥ 0 , i = 1 , 2 , … , m (21) \begin{aligned} &\underset{\lambda}{\text{max}} \quad \sum_{i=1}^m\lambda_i-\frac{1}{2}\sum_{i=1}^m\sum_{j=1}^m\lambda_i\lambda_jy_iy_j\phi(x_i)^T\phi(x_j) \\ &\text{s.t.} \quad \sum_{i=1}^m\lambda_iy_i=0 \\ & \ \ \ \ \ \ \ \ \ \ \lambda_i\geq0, \quad i = 1, 2, \ldots, m \end{aligned} \tag{21} λmaxi=1mλi21i=1mj=1mλiλjyiyjϕ(xi)Tϕ(xj)s.t.i=1mλiyi=0          λi0,i=1,2,,m(21)

求解式(21)中涉及计算 ϕ ( x i ) T ϕ ( x j ) \phi(x_i)^T\phi(x_j) ϕ(xi)Tϕ(xj),这就是样本 x i x_i xi x j x_j xj映射到特征空间之后的内积。由于特征空间的维数高,因此直接计算 ϕ ( x i ) T ϕ ( x j ) \phi(x_i)^T\phi(x_j) ϕ(xi)Tϕ(xj)很困难,为了避开这个障碍,可以设想这样一个函数:
κ ( x i , x j ) = ⟨ ϕ ( x i ) ϕ ( x j ) ⟩ = ϕ ( x i ) T ϕ ( x j ) (22) \kappa(x_i,x_j)=\lang\phi(x_i)\phi(x_j)\rang=\phi(x_i)^T\phi(x_j) \tag{22} κ(xi,xj)=ϕ(xi)ϕ(xj)⟩=ϕ(xi)Tϕ(xj)(22)

于是式(21)可以重写为:
max λ ∑ i = 1 m λ i − 1 2 ∑ i = 1 m ∑ j = 1 m λ i λ j y i y j κ ( x i , x j ) s.t. ∑ i = 1 m λ i y i = 0 λ i ≥ 0 , i = 1 , 2 , … , m (23) \begin{aligned} &\underset{\lambda}{\text{max}} \quad \sum_{i=1}^m\lambda_i-\frac{1}{2}\sum_{i=1}^m\sum_{j=1}^m\lambda_i\lambda_jy_iy_j\kappa(x_i,x_j) \\ &\text{s.t.} \quad \sum_{i=1}^m\lambda_iy_i=0 \\ & \ \ \ \ \ \ \ \ \ \ \lambda_i\geq0, \quad i = 1, 2, \ldots, m \end{aligned} \tag{23} λmaxi=1mλi21i=1mj=1mλiλjyiyjκ(xi,xj)s.t.i=1mλiyi=0          λi0,i=1,2,,m(23)

求解后即可得到:
f ( x ) = w T ϕ ( x ) + b = ∑ i = 1 m λ i y i ϕ ( x i ) T ϕ ( x ) + b = ∑ i = 1 m λ i y i κ ( x , x i ) + b (24) \begin{aligned} f(x)& =w^T\phi(x)+b \\ & =\sum_{i=1}^m\lambda_iy_i\phi(x_i)^T\phi(x)+b \\ & =\sum_{i=1}^m\lambda_iy_i\kappa(x,x_i) +b \end{aligned} \tag{24} f(x)=wTϕ(x)+b=i=1mλiyiϕ(xi)Tϕ(x)+b=i=1mλiyiκ(x,xi)+b(24)

这里的 κ ( ⋅ , ⋅ ) \kappa(\cdot,\cdot) κ(,)就是核函数

定理 6.1(核函数): χ \chi χ为输入空间, κ ( ⋅ , ⋅ ) \kappa(\cdot,\cdot) κ(,)是定义在 χ × χ \chi \times \chi χ×χ上的对称函数,则 κ \kappa κ是核函数当且仅当对于任意数据 D = { x 1 , x 2 , . . . , x m } D=\{x_1,x_2,...,x_m\} D={x1,x2,...,xm}核矩阵 K \Kappa K总是半正定的即(主对角线上全为0且 K ≥ 0 \Kappa \geq0 K0):
K = [ κ ( x 1 , x 1 ) κ ( x 1 , x 2 ) … κ ( x 1 , x m ) κ ( x 2 , x 1 ) κ ( x 2 , x 2 ) … κ ( x 2 , x m ) ⋮ ⋮ ⋱ ⋮ κ ( x m , x 1 ) κ ( x m , x 2 ) … κ ( x m , x m ) ] \Kappa = \begin{bmatrix} \kappa(x_1, x_1) & \kappa(x_1, x_2) & \ldots & \kappa(x_1, x_m) \\ \kappa(x_2, x_1) & \kappa(x_2, x_2) & \ldots & \kappa(x_2, x_m) \\ \vdots & \vdots & \ddots & \vdots \\ \kappa(x_m, x_1) & \kappa(x_m, x_2) & \ldots & \kappa(x_m, x_m) \end{bmatrix} K= κ(x1,x1)κ(x2,x1)κ(xm,x1)κ(x1,x2)κ(x2,x2)κ(xm,x2)κ(x1,xm)κ(x2,xm)κ(xm,xm)

该定理说明,只要一个对称函数所对应的核矩阵半正定,它就能作为核函数使用。事实上,对于一个半正定核矩阵,总能找到一个与之对应的映射 ϕ \phi ϕ。换言之,任何一个核函数都隐式地定义了一个称为再生核希尔伯特空间的特征空间。
故核函数选择称为支持向量机的最大变数。若核函数选择不合适,则意味着将样本映射到一个不合适的特征空间,很可能导致性能不佳。
下表是几种常见的核函数:
在这里插入图片描述
除此之外,我们还可以通过函数组合得到:

  • κ 1 \kappa_1 κ1 κ 2 \kappa_2 κ2为核函数,则对于任意正数 γ 1 \gamma_1 γ1 γ 2 \gamma_2 γ2,其线性组合:
    γ 1 κ 1 + γ 2 κ 2 (25) \gamma_1\kappa_1+\gamma_2\kappa_2\tag{25} γ1κ1+γ2κ2(25)

也是核函数。

  • κ 1 \kappa_1 κ1 κ 2 \kappa_2 κ2为核函数,则该核函数的直积:
    κ 1 ⊗ κ 2 ( x , z ) = κ 1 ( x , z ) κ ( x , z ) (26) \kappa_1\otimes\kappa_2(x,z)=\kappa_1(x,z)\kappa(x,z)\tag{26} κ1κ2(x,z)=κ1(x,z)κ(x,z)(26)
    也是核函数。
  • 若若 κ 1 \kappa_1 κ1为核函数,则对于任意函数 g ( x ) g(x) g(x)
    κ ( x , z ) = g ( x ) κ 1 ( x , z ) g ( z ) (27) \kappa(x,z)=g(x)\kappa_1(x,z)g(z) \tag{27} κ(x,z)=g(x)κ1(x,z)g(z)(27)
    也是核函数。

软间隔与正则化

软间隔

在标准的硬间隔支持向量机中,假设训练数据是线性可分的,即存在一个超平面能够完美地分开两个类别。然而,在实际问题中,数据往往是噪音存在或者非线性可分的,这时候强调完全分类可能导致过拟合。

为了处理非线性可分的情况和噪音,引入了软间隔,允许一些样本点出现在分隔超平面的错误一侧。软间隔 SVM 的目标是找到一个最优的超平面,最小化误分类的同时允许一些样本点落在间隔内。
在这里插入图片描述
软间隔允许某些样本不满足约束:
y i ( w T x i + b ) ≥ 1 (28) y_i(w^Tx_i+b)\geq1 \tag{28} yi(wTxi+b)1(28)
当然,在最大化间隔的同时,不满足约束的样本应尽可能的少。于是,优化目标可写为:
max ( w , b ) 1 2 ∣ ∣ w ∣ ∣ 2 + C ∑ i = 1 m ℓ 0 / 1 ( y i ( w T x i + b ) − 1 ) (29) \begin{aligned} &\underset{(w, b)}{\text{max}} \quad \frac{1}{2}||w||^2+C\sum_{i=1}^m \ell_{0/1}(y_i(w^Tx_i + b)-1) \\ \end{aligned} \tag{29} (w,b)max21∣∣w2+Ci=1m0/1(yi(wTxi+b)1)(29)
其中 C > 0 C>0 C>0是一个常数(容忍范围), ℓ 0 / 1 \ell_{0/1} 0/10/1损失函数(惩罚函数)。
ℓ 0 / 1 ( z ) = { 1 , i f z < 0 0 , o t h e r w i s e (30) \ell_{0/1}(z)= \begin{cases} 1,\quad if \ z< 0\\ 0, \quad otherwise \end{cases} \tag{30} 0/1(z)={1,if z<00,otherwise(30)
显然,当 C C C为无穷大时,式(29)迫使所有样本均满足约束式(28);当 C C C取有极限值时,式(29)允许一些样本不满足约束。

然而现存的问题是 ℓ 0 / 1 \ell_{0/1} 0/1函数的数学性质不好,非凸、非连续,使得式(29)不易直接求解。于是人们常用其他一些函数来替代 ℓ 0 / 1 \ell_{0/1} 0/1,称为替代函数。替代函数具有较好的数学性质。通常用以下三种常用的替代损失函数:
ℓ h i n g e ( z ) = m a x ( 0 , 1 − z ) (31) \ell_{hinge}(z)=max(0,1-z \tag{31}) hinge(z)=max(0,1z)(31)
ℓ e x p ( z ) = e − z (32) \ell_{exp}(z)=e^{-z} \tag{32} exp(z)=ez(32)
ℓ l o g = l o g ( 1 + e − z ) (33) \ell_{log}=log(1+e^{-z})\tag{33} log=log(1+ez)(33)

在这里插入图片描述

若采用hinge损失,则式(29)变成:
max ( w , b ) 1 2 ∣ ∣ w ∣ ∣ 2 + C ∑ i = 1 m m a x ( 0 , 1 − y i ( w T x i + b ) ) (34) \begin{aligned} &\underset{(w, b)}{\text{max}} \quad \frac{1}{2}||w||^2+C\sum_{i=1}^m max(0,1-y_i(w^Tx_i + b)) \\ \end{aligned} \tag{34} (w,b)max21∣∣w2+Ci=1mmax(0,1yi(wTxi+b))(34)
引入松弛变量 ξ i ≥ 0 \xi_i\geq0 ξi0,可将式(34)重写为:
min ( w , b , ξ i ) 1 2 ∣ ∣ w ∣ ∣ 2 + C ∑ i = 1 m ξ i s.t. y i ( w T x i + b ) ≥ 1 − ξ i ξ i ≥ 0 , i = 1 , 2 , … , m (35) \begin{aligned} &\underset{(w, b,\xi_i)}{\text{min}} \quad \frac{1}{2}||w||^2+C\sum_{i=1}^m \xi_i \\ &\text{s.t.} \quad y_i(w^Tx_i+b)\geq1-\xi_i \\ & \ \ \ \ \ \ \ \ \ \ \xi_i\geq0, \quad i = 1, 2, \ldots, m \end{aligned} \tag{35} (w,b,ξi)min21∣∣w2+Ci=1mξis.t.yi(wTxi+b)1ξi          ξi0,i=1,2,,m(35)
这就是常用的软间隔支持向量机

显然,通过拉格朗日乘子法可得到式(35)的拉格朗日函数:
L ( w , b , λ , ξ , μ ) = 1 2 ∣ ∣ w ∣ ∣ 2 + C ∑ i = 1 m ξ i + ∑ i = 1 m λ i ( 1 − ξ i − y i ( w T x i + b ) ) − ∑ i = 1 m μ i ξ i (36) L(w,b,\lambda,\xi,\mu)=\frac{1}{2}||w||^2+C\sum_{i=1}^m \xi_i+\sum_{i=1}^m \lambda_i(1-\xi_i-y_i(w^Tx_i + b))-\sum_{i=1}^m\mu_i\xi_i \tag{36} L(w,b,λ,ξ,μ)=21∣∣w2+Ci=1mξi+i=1mλi(1ξiyi(wTxi+b))i=1mμiξi(36)
其中 λ i ≥ 0 \lambda_i\geq0 λi0 μ i ≥ 0 \mu_i\geq0 μi0是拉格朗日乘子。
L ( w , b , λ , ξ , μ ) L(w,b,\lambda,\xi,\mu) L(w,b,λ,ξ,μ) w w w b b b λ \lambda λ ξ \xi ξ μ \mu μ的偏导为0可得:
{ ∂ L ∂ w = w − ∑ i = 1 m λ i y i x i = 0 ∂ L ∂ b = − ∑ i = 1 m λ i y i = 0 ∂ L ∂ λ = 1 − ξ i − y i ( w T x i + b ) = 0 ∂ L ∂ ξ = C − ∑ i = 1 m λ i − ∑ i = 1 m μ i = 0 ∂ L ∂ μ = − ∑ i = 1 m ξ i = 0 \begin{cases} \frac{\partial L}{\partial w}=w-\sum_{i=1}^m\lambda_iy_ix_i=0 \\ \frac{\partial L}{\partial b}=-\sum_{i=1}^m\lambda_iy_i=0 \\ \frac{\partial L}{\partial \lambda}=1-\xi_i-y_i(w^Tx_i + b)=0\\ \frac{\partial L}{\partial \xi}=C-\sum_{i=1}^m\lambda_i-\sum_{i=1}^m\mu_i=0\\ \frac{\partial L}{\partial \mu}=-\sum_{i=1}^m\xi_i=0 \end{cases} wL=wi=1mλiyixi=0bL=i=1mλiyi=0λL=1ξiyi(wTxi+b)=0ξL=Ci=1mλii=1mμi=0μL=i=1mξi=0
整理可得:
w = ∑ i = 1 m λ i y i x i (37) w=\sum_{i=1}^m\lambda_iy_ix_i \tag{37} w=i=1mλiyixi(37)
∑ i = 1 m λ i y i = 0 (38) \sum_{i=1}^m\lambda_iy_i=0 \tag{38} i=1mλiyi=0(38)
C = ∑ i = 1 m λ i + ∑ i = 1 m μ i (39) C= \sum_{i=1}^m\lambda_i+\sum_{i=1}^m\mu_i\tag{39} C=i=1mλi+i=1mμi(39)
将式(37)-(39)带入式子(35)中可得到式(40)的对偶问题
min ( w , b , ξ i ) ∑ i = 1 m λ i + 1 2 ∑ i = 1 m ∑ j = 1 m λ i λ j y i y j x i T x j s.t. ∑ i = 1 m λ i y i = 0 0 ≤ λ i ≤ C , i = 1 , 2 , … , m (40) \begin{aligned} &\underset{(w, b,\xi_i)}{\text{min}} \quad \sum_{i=1}^m\lambda_i+\frac{1}{2}\sum_{i=1}^m\sum_{j=1}^m \lambda_i\lambda_jy_iy_jx_i^Tx_j \\ &\text{s.t.} \quad \sum_{i=1}^m\lambda_iy_i=0 \\ & \ \ \ \ \ \ \ \ \ \ 0\leq\lambda_i\leq C, \quad i = 1, 2, \ldots, m \end{aligned} \tag{40} (w,b,ξi)mini=1mλi+21i=1mj=1mλiλjyiyjxiTxjs.t.i=1mλiyi=0          0λiC,i=1,2,,m(40)
软间隔相较于硬间隔,两个唯一的差别就在于对偶变量的约束不同:前者是 0 ≤ λ i ≤ C 0\leq \lambda_i\leq C 0λiC,后者是 0 ≤ λ i 0\leq \lambda_i 0λi。于是可采用与硬间隔同样的方法去解决软间隔。类似的,对于软间隔支持向量机,KKT条件要求:
{ λ i ≥ 0 , μ i ≥ 0 y i f ( x i ) − 1 + ξ i ≥ 0 λ i ( y i f ( x i ) − 1 + ξ i ) = 0 ξ i ≥ 0 , μ i ξ i = 0 (41) \begin{cases} \lambda_i\geq0,\quad \mu_i\geq0 \\ y_if(x_i)-1+\xi_i\geq0 \\ \lambda_i(y_if(x_i)-1+\xi_i)=0 \\ \xi_i\geq0,\quad \mu_i\xi_i=0 \end{cases}\tag{41} λi0,μi0yif(xi)1+ξi0λi(yif(xi)1+ξi)=0ξi0,μiξi=0(41)

所以,对于训练样本 ( x i , y i ) (x_i,y_i) (xi,yi),总有 λ i = 1 \lambda_i=1 λi=1 y i f ( x i ) = 1 − ξ i y_if(x_i)=1-\xi_i yif(xi)=1ξi

  • λ i = 0 \lambda_i=0 λi=0,则有式(12) f ( x ) = ∑ i = 1 m λ i y i x i T x + b = b f(x)=\sum_{i=1}^m\lambda_iy_ix_i^Tx+b=b f(x)=i=1mλiyixiTx+b=b,即 λ i \lambda_i λi不会对 f ( x ) f(x) f(x)产生任何影响,那么对应的样本不是支持向量,因为它对目标函数没有贡献。
  • λ i > 0 \lambda_i>0 λi>0,则必有 y i f ( x i ) = 1 − ξ i y_if(x_i)=1-\xi_i yif(xi)=1ξi,是一个支持向量。

由式(39)可知;

  • λ i < C \lambda_i<C λi<C,则 μ i > 0 \mu_i>0 μi>0,又因为 μ i ξ i = 0 \mu_i\xi_i=0 μiξi=0进而有 ξ i = 0 \xi_i=0 ξi=0,即样本呢恰好在最大间隔边界上。 ≤ \leq
  • λ i = C \lambda_i=C λi=C,则 μ i = 0 \mu_i=0 μi=0
    • 此时若 ξ i ≤ 1 \xi_i\leq1 ξi1,则样本落在最大间隔内部。
    • ξ i > 1 \xi_i>1 ξi>1,则该样本被分类错误。

在这里插入图片描述
由此可知,软间隔支持向量机的最终模型仅与支持向量有关,通过使用了 hinge 损失函数。这个损失函数在一定程度上惩罚了误分类的数据点,并且对于正确分类的数据点和那些在间隔内但仍允许一定误差的数据点是不敏感的。因此,对于在间隔内的数据点,只有当它们的误差超过一定阈值时,才会对模型参数的更新产生影响,否则它们的存在对模型的稀疏性保持了贡献。

正则化(罚函数法)

我们可以把式(29)中的 0 / 1 0/1 0/1损失函数替换成别的替代损失函数,从而得到其他的学习模型,这些模型的性质与所用的替代函数直接相关,他们都具有相同的共性:

  • 第一项:描述划分超平面的间隔大小。
  • 另一项: ∑ i = 1 m ℓ ( f ( x i ) , y i ) \sum_{i=1}^m\ell(f(x_i),y_i) i=1m(f(xi),yi)用来表述训练集上的误差。

故我们可以写成更一般的形式:
min f Ω ( f ) + C ∑ i = 1 m ℓ ( f ( x i ) , y i ) (42) \begin{aligned} &\underset{f}{\text{min}} \quad \Omega(f)+C\sum_{i=1}^m \ell(f(x_i),y_i) \\ \end{aligned} \tag{42} fminΩ(f)+Ci=1m(f(xi),yi)(42)

其中 Ω ( f ) \Omega(f) Ω(f)称为结构风险,用于描述模型 f f f的性质。第二项 ∑ i = 1 m ℓ ( f ( x i ) , y i ) \sum_{i=1}^m \ell(f(x_i),y_i) i=1m(f(xi),yi)称为经验风险,用于描述模型与训练数据的契合程度。 C C C用于对二者进行折中。

以正则化的角度来说, Ω ( f ) \Omega(f) Ω(f)被称作正则化项, C C C称为正则化常数。 L p L_p Lp范数是常用的正则化项,其中 L 2 L_2 L2范数 ∣ ∣ w ∣ ∣ 2 ||w||_2 ∣∣w2倾向于 w w w的分量取值尽量均衡,即非零分量个数尽量稠密,而 L 0 L_0 L0范数 ∣ ∣ w ∣ ∣ 0 ||w||_0 ∣∣w0 L 1 L_1 L1范数 ∣ ∣ w ∣ ∣ 1 ||w||_1 ∣∣w1则倾向于 w w w的分量尽量稀疏,即非零分量个数尽量少。

范数

下面我们来详细说明一下"非零分量个数尽量少"和"非零分量个数尽量稠密":

  1. 非零分量个数尽量少:

    • 这意味着在模型的参数中,很多权重被设为零,而只有少数权重是非零的。这通常是通过使用 L 1 L_1 L1 范数正则化来实现的,因为 L 1 L_1 L1 范数鼓励参数向量中的某些元素取零值,使得模型更加稀疏。
    • 目的是为了让模型更加简单,降低模型的复杂度,以防止过拟合。在某些场景下,只有少数几个特征对预测结果有显著的贡献,而其他特征的权重可以被设置为零。
  2. 非零分量个数尽量稠密:

    • 这意味着模型的参数中非零元素的分布相对均匀,而非零权重的数量相对较多。这通常是通过使用 L 2 L_2 L2 范数正则化来实现的,因为 L 2 L_2 L2 范数鼓励参数向量中的所有元素都较小,但非零元素的数量不一定很少。
    • 目的是为了平衡模型各个参数的影响,防止某些特征对预测结果过于显著,以免引入不必要的偏差。

模型的稀疏性

模型的稀疏性是指在模型中只有少数非零参数或特征的性质。在统计学和机器学习中,一个稀疏的模型意味着模型的大部分参数或特征都是零,只有一小部分参数或特征对最终的预测起到关键作用。

对于线性模型,稀疏性通常表现为只有一小部分权重对最终的预测有贡献,其他权重为零。对于特征选择和解释性而言,稀疏性是一个重要的性质,因为它可以帮助识别对输出变量有显著影响的关键特征。

支持向量机(SVM)是一种能够产生稀疏模型的算法。在软间隔支持向量机中,只有一小部分数据点被称为支持向量,它们对于定义决策边界和间隔的计算起到关键作用,而其他数据点对于模型的参数调整影响较小。

稀疏模型有一些优点,包括:

  1. 更好的泛化能力: 稀疏模型通常对未见过的数据更具泛化能力,因为它们更倾向于捕捉数据中真正重要的模式,而不受不相关的特征的干扰。

  2. 更容易解释: 当模型的大部分参数为零时,模型的解释变得更加简单和直观。只有非零参数或特征需要考虑,这有助于理解模型在决策时的关键因素。

  3. 减少存储和计算成本: 稀疏模型需要存储和计算的资源较少,因为只有少数参数或特征需要被处理。

结论

在本篇文章中,我们深入探讨了支持向量机(SVM)的基本原理、核函数的作用以及正则化的概念。通过详细介绍硬间隔和软间隔支持向量机的推导过程,我们理解了在处理非线性可分数据和噪音时,软间隔的重要性。

核函数作为 SVM 中的关键组成部分,通过将数据映射到高维空间,使得在原始特征空间中线性不可分的问题在新的特征空间中变得线性可分。我们还介绍了常见的核函数及其组合形式,以及核函数与再生核希尔伯特空间的关系。

正则化在软间隔支持向量机中发挥了关键作用,通过引入正则化项,我们可以在最大化间隔的同时控制模型的复杂度,使其更好地泛化到新的数据。不同范数的使用对模型的稀疏性产生不同影响,这在解释性和计算效率上都具有重要意义。

最后,我们强调了稀疏模型的优势,包括更好的泛化能力、更容易解释和减少资源消耗。这篇文章为读者提供了深入理解支持向量机及其相关概念的基础,有助于读者更好地应用和理解这一强大的机器学习算法。

实验分析

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from sklearn.discriminant_analysis import LinearDiscriminantAnalysis
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score# 读取数据集
df = pd.read_csv('data/nonlinear_svm_ring_dataset.csv')

在这里插入图片描述
该数据集所对应的散点图

# 绘制散点图
plt.scatter(df[df['Label'] == 1]['Feature1'], df[df['Label'] == 1]['Feature2'], label='Class 1')
plt.scatter(df[df['Label'] == -1]['Feature1'], df[df['Label'] == -1]['Feature2'], label='Class -1')plt.xlabel('Feature 1')
plt.ylabel('Feature 2')
plt.legend()
plt.title('Nonlinear SVM Ring Dataset')
plt.show()

在这里插入图片描述
数据升维后的散点图

# 创建3D图形
fig = plt.figure()
ax = fig.add_subplot(111, projection='3d')# 绘制3D散点图
ax.scatter(X_test[y_test == 1]['Feature1'], X_test[y_test == 1]['Feature2'], y_test[y_test == 1], label='Class 1')
ax.scatter(X_test[y_test == -1]['Feature1'], X_test[y_test == -1]['Feature2'], y_test[y_test == -1], label='Class -1')# 设置坐标轴标签
ax.set_xlabel('Feature 1')
ax.set_ylabel('Feature 2')
ax.set_zlabel('Label')# 添加图例
ax.legend()
plt.title('SVM Decision Boundary on Nonlinear Separable Dataset (3D)')# 显示图形
plt.show()

划分数据集

# 准备数据
X = df[['Feature1', 'Feature2']]
y = df['Label']# 划分训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

在这里插入图片描述
明显线性可分了!

  • 先采用LDA(线性判别分析):看看其模型的表现如何?

LDA

# 初始化LDA模型
lda_model = LinearDiscriminantAnalysis()# 拟合模型
lda_model.fit(X_train, y_train)# 在测试集上进行预测
y_pred = lda_model.predict(X_test)# 计算准确度
accuracy = accuracy_score(y_test, y_pred)
print(f'Accuracy: {accuracy * 100:.2f}%')# 绘制决策边界
plt.scatter(df[df['Label'] == 1]['Feature1'], df[df['Label'] == 1]['Feature2'], label='Class 1')
plt.scatter(df[df['Label'] == -1]['Feature1'], df[df['Label'] == -1]['Feature2'], label='Class -1')# 绘制决策边界
xx, yy = np.meshgrid(np.linspace(np.min(X['Feature1']), np.max(X['Feature1']), 100),np.linspace(np.min(X['Feature2']), np.max(X['Feature2']), 100))
Z = lda_model.decision_function(np.c_[xx.ravel(), yy.ravel()])
Z = Z.reshape(xx.shape)plt.contour(xx, yy, Z, colors='k', levels=[0], linestyles='dashed')plt.xlabel('Feature 1')
plt.ylabel('Feature 2')
plt.legend()
plt.title('LDA Decision Boundary on Nonlinear Separable Dataset')
plt.show()

在这里插入图片描述

Accuracy: 45.00%:显然模型在非线性数据下表现不佳!

  • 然后采用SVM(支持向量机):看看模型的表现如何?
# 初始化SVM模型
svm_model = SVC(kernel='rbf', C=1.0, gamma='scale')# 拟合模型
svm_model.fit(X_train, y_train)# 在测试集上进行预测
y_pred = svm_model.predict(X_test)# 计算准确度
accuracy = accuracy_score(y_test, y_pred)
print(f'Accuracy: {accuracy * 100:.2f}%')# 绘制散点图
plt.scatter(df[df['Label'] == 1]['Feature1'], df[df['Label'] == 1]['Feature2'], label='Class 1')
plt.scatter(df[df['Label'] == -1]['Feature1'], df[df['Label'] == -1]['Feature2'], label='Class -1')# 绘制决策边界
xx, yy = np.meshgrid(np.linspace(np.min(X['Feature1']), np.max(X['Feature1']), 100),np.linspace(np.min(X['Feature2']), np.max(X['Feature2']), 100))
Z = svm_model.decision_function(np.c_[xx.ravel(), yy.ravel()])
Z = Z.reshape(xx.shape)plt.contour(xx, yy, Z, colors='k', levels=[0], linestyles='dashed')plt.xlabel('Feature 1')
plt.ylabel('Feature 2')
plt.legend()
plt.title('SVM Decision Boundary on Nonlinear Separable Dataset')
plt.show()

在这里插入图片描述
Accuracy: 100.00%:显然SVM在该数据集下表现良好!

在非线性可分数据集上,通过使用线性判别分析(LDA)和支持向量机(SVM)两种不同的分类器进行比较:

  1. LDA模型:

    • 准确度:45.00%
    • 决策边界:LDA在非线性可分数据集上表现不佳,因为它是线性分类器,无法很好地捕捉数据中的非线性关系。
  2. SVM模型:

    • 准确度:100.00%
    • 决策边界:SVM在非线性可分数据集上表现良好,通过使用径向基函数(RBF kernel),SVM能够将数据映射到高维空间,并在该空间中找到有效的决策边界,实现了高准确度的分类。

总结:在处理非线性可分数据集时,SVM相对于LDA表现更好。SVM通过引入核函数,实现了将数据映射到更高维度的特征空间,从而能够更好地处理非线性关系。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/618651.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

蓝牙音视频远程控制协议(AVRCP) AV/C command格式介绍

零.声明 本专栏文章我们会以连载的方式持续更新&#xff0c;本专栏计划更新内容如下&#xff1a; 第一篇:蓝牙综合介绍 &#xff0c;主要介绍蓝牙的一些概念&#xff0c;产生背景&#xff0c;发展轨迹&#xff0c;市面蓝牙介绍&#xff0c;以及蓝牙开发板介绍。 第二篇:Trans…

生产数据不备份,用时两行泪

背景&#xff1a;项目使用pg一主一从&#xff0c;因慢sql导致查询慢&#xff0c;所以想从原本的4核加到16核&#xff0c;联系好运维后&#xff0c;打算先从从库开始操作&#xff0c;机器上的pgsql都正常关闭&#xff0c;然后停止&#xff0c;关机&#xff0c;扩容一切都很顺利&…

OpenCV-Python(34):FAST算法

目标 理解 FAST 算法的基础使用OpenCV 中的FAST 算法相关函数进行角点检测 介绍 FAST算法&#xff08;Features from Accelerated Segment Test&#xff09;是一种用于在图像中快速检测角点的算法。它是一种基于像素的检测方法&#xff0c;具有高效、准确的特点&#xff0c;常…

【算法分析与设计】最短路径和

题目&#xff1a; 给定一个包含非负整数的 m x n 网格 grid &#xff0c;请找出一条从左上角到右下角的路径&#xff0c;使得路径上的数字总和为最小。 说明&#xff1a;每次只能向下或者向右移动一步。 示例&#xff1a; 示例 1&#xff1a; 输入&#xff1a;grid [[1,3,1],…

【PHP AES加解密示例】从入门到精通,一篇文章让你掌握加密解密技术!

一、引言 随着互联网的普及&#xff0c;数据安全问题越来越受到人们的关注。在众多加密算法中&#xff0c;AES&#xff08;Advanced Encryption Standard&#xff09;因其高效、安全的特点被广泛应用。本文将通过PHP语言&#xff0c;为大家展示一个简单的AES加解密示例&#x…

Retinal Structure Detection in OCTA Image viaVoting-Based Multitask Learning

一、摘要 研究背景&#xff1a;自动检测视网膜结构&#xff0c;如视网膜血管(RV)、中央凹血管区(FAZ)和视网膜血管连接(RVJ)&#xff0c;对了解眼部疾病和临床决策具有重要意义。 主要工作&#xff1a;在本文中&#xff0c;提出了一种新的基于投票的自适应特征融合多任务网络…

Pr模板(剪辑素材),Pr预设(视频转场,调色),Pr插件,Pr教程,Pr模板网

PR模板,免费Premiere模板下载网站.logo片头模板,标题字幕,样机相册,节奏快闪,开场预告,转场特效,图文照片,抖音自媒体Vlog短视频模板等Premiere项目工程源文件模板下载 Pr模板&#xff1a;https://prmuban.com/template PR预设,PR转场预设,PR调色预设,Pr剪辑视频特效PR预设.pr…

优化的实时换脸项目——DeepFaceLive

DeepFaceLive是一款基于人工智能技术的换脸工具&#xff0c;可以实现实时面部捕捉和换脸效果。它利用深度学习和计算机视觉算法&#xff0c;能够以惊人的准确度和速度将脸部特征无缝地映射到任何人的脸上。DeepFaceLive的特点是可以实时换脸&#xff0c;让用户通过网络摄像头应…

MySQL高可用解决方案演进:从主从复制到InnoDB Cluster架构

目录 前言 1. 主从复制 主从复制的基本配置示例&#xff1a; 2. 主从复制的限制 3. InnoDB Cluster架构 InnoDB Cluster配置步骤示例&#xff1a; 4. InnoDB Cluster的优势 总结 ⭐️ 好书推荐 前言 前些天发现了一个巨牛的人工智能学习网站&#xff0c;通俗易懂&…

京东年度数据报告-2023全年度游戏本十大热门品牌销量(销额)榜单

同笔记本市场类似&#xff0c;2023年度游戏本市场的整体销售也呈下滑态势。根据鲸参谋电商数据分析平台的相关数据显示&#xff0c;京东平台上游戏本的年度销量累计超过350万&#xff0c;同比下滑约6%&#xff1b;销售额将近270亿&#xff0c;同比下滑约11%。 鲸参谋综合了京东…

C语言变量与函数

目录 变量函数 变量 变量&#xff1a;计算机里的一块内存空间int a 0; 表示定义一个整型 int 变量&#xff1b;这个变量名字叫做 a “” 表示赋值&#xff1b;即将右边的 0 赋值给左边的整型变量 a 现在这一块空间 a 存放了一个值 0 这个过程也叫做整型变量 a 的初始化初始化…

C++/WinRT 简介

C/WinRT 是 Windows 运行时 (WinRT) API 的完全标准新式 C17 语言投影&#xff0c;以基于标头文件的库的形式实现&#xff0c;旨在为你提供对新式 Windows API 的一流访问。 利用 C/WinRT&#xff0c;你可以采用任何符合标准的 C17 编译器创作和使用 Windows 运行时 API。 Wind…

OSG StatsHandler 初步学习

osg为视景器的使用和调试提供了丰富的辅助组件&#xff0c;它们主要是以osg::ViewerBase的成员变量或交互事件处理器(osgGA::GUIEventHandler)的形式出现。osgViewer::StatsHandler、osg::Stats类就是其中的两个经常用到的辅助组件。 #include<osgViewer/Viewer> #inclu…

iOS xcode 15.1 打包报错

真机调试的时候没问题&#xff0c;打包的时候报错了 #报错 解决办法 pods.xcodeproj - build phases - compile sources - compiler flags pods.xcodeproj - Targets-support files pods-xx-frameworks

GitHub Copilot的使用方法和快捷按键

GitHub Copilot是GitHub与OpenAI合作开发的一款人工智能编码助手。它基于GPT&#xff08;Generative Pre-trained Transformer&#xff09;模型&#xff0c;可以为你提供代码补全、建议和生成的功能 使用方法&#xff1a; 安装插件&#xff1a; 首先&#xff0c;确保你的开发环…

[redis] redis的安装,配置与简单操作

一、缓存的相关知识 1.1 缓存的概念 缓存是为了调节速度不一致的两个或多个不同的物质的速度&#xff0c;在中间对速度较慢的一方起到加速作用&#xff0c;比如CPU的一级、二级缓存是保存了CPU最近经常访问的数据&#xff0c;内存是保存CPU经常访问硬盘的数据&#xff0c;而且…

LeetCode讲解篇之39. 组合总和

文章目录 题目描述题解思路题解代码 题目描述 题解思路 首先排序数组&#xff0c;然后开始选择数字&#xff0c;当选择数字num后&#xff0c;在去选择大于等于num的合法数字&#xff0c;计算过程中的数字和&#xff0c;直到选数字和等于target, 加入结果集&#xff0c;若数字和…

关于镜头选型时的一些注意事项

1、问题背景 最近的项目调试过程中&#xff0c;遇到与镜头相关的问题比较多。所以本文主要总结一下镜头选型时需注意的事项&#xff0c;保证在项目前期就能规避掉一些问题&#xff0c;避免项目延期。 2、问题分析 我们拿到手的一般都是摄像头模组&#xff0c;在进行摄像头调试时…

114.QTimer类和QWidget类

目录 一、QTimer类 定时器使用举例&#xff1a; 二、QWidget类 2.1设置父对象 2.2窗口位置 2.3窗口尺寸 2.4窗口标题和图标 2.5信号 2.6槽函数 示例代码&#xff1a; 一、QTimer类 QTimer 是 Qt 中用于实现定时器的类。它可以在一定的时间间隔内发射信号&#xff0c;…

品牌帮助中心:提升企业客户服务水平与效率的实用指南

什么是品牌帮助中心&#xff1f;简单来理解&#xff0c;他就是一种加速问题解决效率的方式&#xff0c;是通过在官网设置文章库或者社区的形式&#xff0c;为客户提供自助服务&#xff0c;自我查找问题答案。是一种既能提升问题解决效率&#xff0c;又能提升品牌形象的方式。接…