1.原理
1.1 每一个像元作为一个样本,波段作为特征,理想情况下,同类地物应该具有相同或相似的特征描述,因此像元在n维特征空间中聚集在一起,而不同地物应该具有不同的特征描述,因此不同特征地物像元在n维空间中呈现分离状态。
1.2 一个像元可以看成有n个特征组成的n维空间中的一个点;同类地物的像元形成n维空间中的一个点群,差异明显的不同地物会构成n维空间的若干个点群。
1.3 分类就是要分析特征空间这些点群的特征,如点群的位置。分布中心,从而确定点群的界限,完成分类任务。
2.分类过程
- 数据获取;
- 数据预处理;
- 分类类别确定和介意标志建立;
- 训练样本选取和评价;
- 特征提取和选择;
- 分类方法选择;
- 图像分类;
- 分类后处理;
- 精度评价;
3.训练样本选取
3.1 样本个数与所采用的分类方法,特征空间维度数,个类别的大小与分布有光;
3.2 一般情况下,每个类别的训练样本个数至少是特征空间维度的10~30倍。
3.2 采集策略:小区域连续采集,全局均匀分布的采集策略,分层采集,地理分层采集;
4.训练样本评价
4.1 判断训练样本是否能表现不同的光谱特征,即不同类别的光谱特征向量的分离程度。
4.2 评价方法
-
图表法:均值图法,直方图法;
- 均值图法:把各类别在不同特种空间(波段)的样本点特征值求均值和标准差,构建一个折线图来判断不同类别在不同特征空间的分布情况。
图中,在每个波段上均值都比较接近的样本,是无法区分的,考虑先把它合并,或者考虑其他特征来区分。 - 直方图法
图中,第一个图曲线有交叉重合部分,不能很好的区分,第二个图能区分,越瘦的越好区分,越胖的越不好区分。
- 均值图法:把各类别在不同特种空间(波段)的样本点特征值求均值和标准差,构建一个折线图来判断不同类别在不同特征空间的分布情况。
-
统计法;
-
特征空间多维图法:即把训练样本的光谱特征向量表示在多维的窗口中,可以直观的展现所有样本的光谱特证分布状况。
5.分类方法
- 监督分类方法:
- 欧式距离;
- 最大似然法;
- 支持向量机分类算法:采用升维后在分类;
- 深度学习方法;
- 非监督分类器
- k-均值算法;
6.分类精度评价
6.1 检验样本选取:简单随机采杨;每个类别的检验样本数量至少得有50个样本;
6.1 混淆矩阵
- 可以计算总体分类精度,被正确分类的在对角线分布;
- 制图精度:
- Kappa系数:采用一种离散多元统计技术,它综合运用了混淆矩阵的所有参数来计算一个最终指标;
6.2 ROC 曲线,主要是二分类问题。
7.特征提取
7.1 衍生特征:把某些或者所有原始属性通过变换生成新的特征变量,从而增强目标物体之间的可分性,通过变换方式得到新的特征变量的过程就是特征提取。
7.2 特征变量过多会引起“维度灾难”,使得识别精度下降。
7.3 光谱特征提取
- 对多种属性线性或非线性组合得到综合指标;
- 在高光谱图像图像中,临近波段之间往往具有高度的相关性,需要从这些数据中提取无冗余的有效信息来识别地物。