文章目录
- 一、综述
- 二、奇异值分解
- 三、使用SVD进行降维
- 四、SVD的评价及应用
一、综述
奇异值分解是线性代数中一种重要的矩阵分解方法,它在图形的压缩等方面具有重要的意义及作用。
二、奇异值分解
- 三个引理:
- AB 和 BA 非零的特征值完全相同;
- 实对称矩阵的特征值一定为实数,且一定可以相似对角化,特征向量构成的矩阵可通过施密特正交化变为正交矩阵。
- AATAA^TAAT 一定是半正定矩阵,因此其特征值不可能为负数。
- 奇异值分解
Am×n=Um×m∑m×nVn×nTA_{m \times n} = U_{m \times m}\sum_{m \times n}V^T_{n \times n}Am×n=Um×m∑m×nVn×nT,其中 UUU 和 VVV 都是正交矩阵,且 ∑\sum∑ 是奇异值矩阵(对角元素从大到小排列,这些元素称为奇异值。其他元素为0)- U的计算
先计算 AATAA^TAAT,它是一个 mmm 阶的对称矩阵,从而可以对 AATAA^TAAT 进行相似对角化,同时将特征值从大到小排列,从而 AAT=UΛ1UTAA^T = U\Lambda_1U^TAAT=UΛ1UT,从而可以求出矩阵 UUU。 - V的计算
先计算 ATAA^TAATA,它是一个 nnn 阶的对称矩阵,那么我们可以对 ATAA^TAATA 相似对角化,同时也将特征值按从大到小排列,从而 ATA=VΛ2VTA^TA = V\Lambda_2V^TATA=VΛ2VT,从而可以求出矩阵 VVV。 - ∑\sum∑ 的计算
取出 AATAA^TAAT(或者 ATAA^TAATA,二者特征值相同)的非零特征值并开方,便得到了奇异值。然后将这些奇异值按照从大到小填充到 ∑\sum∑ 的主对角线上,其他位置为0,从而便得到了矩阵 ∑\sum∑。
- U的计算
三、使用SVD进行降维
所谓的使用SVD来进行降维,就是使矩阵的秩减小,矩阵的大小不变。
下面来看一个例子:
该分解保留原矩阵的特征比例 = 8.45+4.948.45+4.94+1.11×100%=92.34%\frac{8.45 + 4.94}{8.45 + 4.94 + 1.11} \times 100\% = 92.34\%8.45+4.94+1.118.45+4.94×100%=92.34%
除此之外,我们还可以自定义需要保留的特征比例,从而保留对应比例的矩阵。
四、SVD的评价及应用
- 评价
- 优点:简化数据,去除噪声点,对数据进行降维。
- 缺点:数据的转换难以理解
- 应用:
- 对图片和视频数据进行压缩(图片主要是像素点以及RGB色彩混合而形成的图像,可以对其进行SVD分解,从而达到压缩目的)。
- 潜在语义索引
- 推荐系统