西瓜书学习——线性判别分析

文章目录

定义
LDA的具体步骤
- 1. 计算类内散布矩阵（Within-Class Scatter Matrix）
- 2. 计算类间散布矩阵（Between-Class Scatter Matrix）
- 3. 求解最佳投影向量
- 4. 数据投影
- 5. 分类

定义

线性判别分析（Linear Discriminant Analysis，简称LDA）是一种常用的监督学习降维技术，主要应用于模式识别和机器学习领域。LDA的核心思想是将高维的数据投影到低维空间，使得投影后的数据在同一类内部尽可能紧凑，不同类之间尽可能分离，从而达到分类的目的。

在这里插入图片描述

LDA的具体步骤

1. 计算类内散布矩阵（Within-Class Scatter Matrix）

首先，对于每个类别，我们需要计算其均值和协方差矩阵。假设我们有 $K$ 个类别，对于第 $k$ 类，其均值向量表示为 $\mu_k$ ，协方差矩阵表示为 $\Sigma_k$ 。类内散布矩阵 $S_w$ 可以通过以下公式计算：
$S_w = \sum_{k=1}^{K} \sum_{x \in X_k} (x - \mu_k)(x - \mu_k)^T$

其中， $X_k$ 表示属于第 $k$ 类的所有样本。类内散布矩阵反映了同类数据内部的离散程度。

2. 计算类间散布矩阵（Between-Class Scatter Matrix）

类间散布矩阵 $S_b$ 可以通过以下公式计算：

$S_b = \sum_{k=1}^{K} N_k (\mu_k - \mu)(\mu_k - \mu)^T$

其中， $N_k$ 是第kk类的样本数量， $\mu$ 是所有样本的总体均值。类间散布矩阵反映了不同类别数据之间的离散程度。

3. 求解最佳投影向量

LDA 的目标是找到一个投影向量 $w$ ，使得数据在该向量上的投影能够最大化类间散布与类内散布的比值。这个投影向量可以通过求解下面的最优化问题得到：
$\max_w \frac{w^T S_b w}{w^T S_w w}$
这个最优化问题等价于求解 $S_w^{-1} S_b$ 的最大特征值对应的特征向量。因此，我们可以通过计算特征值和特征向量来找到最佳的投影向量 $w$ 。