文章目录
- 1. 正定矩阵的判定标准
- 2. 非正定矩阵
- 3. 能量方程
- 3. 正定方程
- 4. 半正定矩阵
1. 正定矩阵的判定标准
目前我们有 5
种方法判断矩阵是否为正定矩阵:
- 所有的特征值大于零: λ i > 0 \lambda_i>0 λi>0
- 对于所有的非零向量x,能量方程大于零, x T S x > 0 x^TSx>0 xTSx>0
- S = A T A S=A^TA S=ATA,当矩阵A列满秩
- 所有的顺序主子式均大于零, D i > 0 D_i>0 Di>0
- 所有的主元均大于零, P i v o t i > 0 Pivot_i>0 Pivoti>0
2. 非正定矩阵
- 假设我们有一个矩阵S,判断其是否为正定矩阵
S = [ 3 4 4 5 ] → ∣ S ∣ = − 1 → S 非正定矩阵 \begin{equation} S=\begin{bmatrix} 3&4\\\\ 4&5 \end{bmatrix}\rightarrow |S|=-1\rightarrow S非正定矩阵 \end{equation} S= 3445 →∣S∣=−1→S非正定矩阵 - 假设我们有一个矩阵S,判断其是否为正定矩阵
S = [ 3 4 4 16 3 ] → ∣ S ∣ = 0 → S 为半正定矩阵 \begin{equation} S=\begin{bmatrix} 3&4\\\\ 4&\frac{16}{3} \end{bmatrix}\rightarrow |S|=0\rightarrow S 为半正定矩阵 \end{equation} S= 344316 →∣S∣=0→S为半正定矩阵
3. 能量方程
假设我们有如下能量方程,绘出其图像:
S = f ( x , y ) = [ x y ] [ 3 4 4 6 ] [ x y ] = 3 x 2 + 8 x y + 6 y 2 \begin{equation} S=f(x,y)=\begin{bmatrix} x&y \end{bmatrix}\begin{bmatrix} 3&4\\\\ 4&6 \end{bmatrix}\begin{bmatrix} x\\\\y \end{bmatrix}=3x^2+8xy+6y^2 \end{equation} S=f(x,y)=[xy] 3446 xy =3x2+8xy+6y2
- 函数的梯度表示如下:
[ ∂ f ( x , y ) ∂ x ∂ f ( x , y ) ∂ y ] = [ 6 x + 8 y 8 x + 12 y ] \begin{equation} \begin{bmatrix} \frac{\partial f(x,y)}{\partial x}\\\\ \frac{\partial f(x,y)}{\partial y} \end{bmatrix}=\begin{bmatrix} 6x+8y\\\\ 8x+12y \end{bmatrix} \end{equation} ∂x∂f(x,y)∂y∂f(x,y) = 6x+8y8x+12y
- 深度学习梯度下降示意图
如何通俗地解释梯度下降法
我们通常情况下,损失函数会用二次型加上非线性函数,所以我们深度学习的主要目的是在损失函数图上通过梯度下降法来找到最小损失,具体解释看链接。
3. 正定方程
- 假设S,T均为正定矩阵,那S+T是否为正定矩阵呢?
x T S x > 0 , x T T x > 0 → x T ( S + T ) x = x T S x + x T T x > 0 \begin{equation} x^TSx>0,x^TTx>0\rightarrow x^T(S+T)x=x^TSx+x^TTx>0 \end{equation} xTSx>0,xTTx>0→xT(S+T)x=xTSx+xTTx>0
所以S+T为正定矩阵 - 假设S是正定矩阵,Q为正交矩阵, Q T Q = I Q^TQ=I QTQ=I,请问 Q T S Q Q^TSQ QTSQ是否是正定矩阵?
Q T S Q = Q − 1 S Q = A → A ∼ S → λ A = λ S → A 为正定矩阵 \begin{equation} Q^TSQ=Q^{-1}SQ=A\rightarrow A\sim S \rightarrow \lambda_A=\lambda_S\rightarrow A为正定矩阵 \end{equation} QTSQ=Q−1SQ=A→A∼S→λA=λS→A为正定矩阵
Q T S Q → x T Q T S Q x = ( Q x ) T S ( Q x ) > 0 \begin{equation} Q^TSQ\rightarrow x^TQ^TSQx=(Qx)^TS(Qx)>0 \end{equation} QTSQ→xTQTSQx=(Qx)TS(Qx)>0
4. 半正定矩阵
假设矩阵A表示如下:
A = [ 1 1 1 1 1 1 1 1 1 ] → r a n k ( A ) = 1 → N ( A ) = 3 − 1 = 2 \begin{equation} A=\begin{bmatrix} 1&1&1\\\\ 1&1&1\\\\ 1&1&1 \end{bmatrix}\rightarrow rank(A)=1\rightarrow N(A)=3-1=2 \end{equation} A= 111111111 →rank(A)=1→N(A)=3−1=2
- 也就是说矩阵A有两个零向量, A x 1 = 0 x 1 , A x 2 = 0 x 2 → λ 1 = λ 2 = 0 , λ 3 = 1 + 1 + 1 − 0 = 3 Ax_1=0x_1,Ax_2=0x_2\rightarrow \lambda_1=\lambda_2=0,\lambda_3=1+1+1-0=3 Ax1=0x1,Ax2=0x2→λ1=λ2=0,λ3=1+1+1−0=3,所以矩阵A为半正定矩阵。
- 可以将矩阵分解如下:
A = λ 1 q 1 q 1 T + λ 2 q 2 q 2 T + λ 3 q 3 q 3 T = λ 3 q 3 q 3 T \begin{equation} A=\lambda_1q_1q_1^T+\lambda_2q_2q_2^T+\lambda_3q_3q_3^T=\lambda_3q_3q_3^T \end{equation} A=λ1q1q1T+λ2q2q2T+λ3q3q3T=λ3q3q3T
A = 3 [ 1 3 1 3 1 3 ] [ 1 3 1 3 1 3 ] \begin{equation} A=3\begin{bmatrix} \frac{1}{\sqrt{3}}\\\\ \frac{1}{\sqrt{3}}\\\\ \frac{1}{\sqrt{3}} \end{bmatrix}\begin{bmatrix} \frac{1}{\sqrt{3}}& \frac{1}{\sqrt{3}}& \frac{1}{\sqrt{3}} \end{bmatrix} \end{equation} A=3 313131 [313131]