一种遥感影像多类变化检测方法

多任务学习孪生网络的遥感影像多类变化检测

马惠1, 刘波2, 杜世宏2

1.河南省国土空间调查规划院,郑州 450016

2.北京大学遥感与地理信息系统研究所,北京 100871

摘要:

精确掌握土地覆盖/利用的变化及变化类型对国土空间规划、生态环境监测、灾害评估等有着重要意义,然而现有大部分变化检测研究主要关注二值变化检测。为此,该文首先提出了一种多任务学习深度孪生网络用于遥感影像的多类变化检测。首先提出面向对象的无监督变化检测方法,选择出新、旧时相影像中最有可能发生变化和最不可能发生变化的区域,并作为多任务学习深度孪生网络的样本; 其次,采用多任务学习深度孪生网络模型同时对新、旧时相的土地利用图以及新、旧时相的二值变化图这3个任务模型进行学习和预测; 最后,基于模型预测的新、旧时相土地利用图及新、旧时相的二值变化图获取最终的多类变化检测结果。采用第三次全国国土调查的影像数据和相应的土地利用图斑数据对多任务学习深度孪生网络模型进行了测试,结果表明所提出的方法适用于这种在没有变化、未变化样本而有历史专题图的变化检测场景中。

0 引言

人类所生存的地表环境无时无刻不在发生着变化,这些变化有些是对人类有益的,有些则是会对自然资源产生严重的破坏。因此,精确掌握这些变化十分必要。自20世纪60年代至今,遥感技术经过几十年的发展,已经可以获取高空间分辨率、高时间分辨率、高光谱分辨率和高辐射分辨率的遥感影像,利用遥感技术来对地表变化进行检测是一种行之有效的方法。目前,基于遥感的变化检测已经在城市规划、植被变化、灾害监测、地图更新和生态环境保护等多个领域得到了广泛的应用。

当前,用于变化检测的方法主要有传统机器学习方法和最新的深度学习方法。传统机器学习方法包括支撑向量机(support vector machine,SVM)、决策树、随机森林(random forest,RF)、人工神经网络(artificial neural networks,ANN)、水平集、马尔可夫随机场(Markov random field,MRF)、条件随机场(conditional random field,CRF)等,相比于早期的图像差分法、代数法、变换法等变化检测方法,这些方法显著提高了遥感变化检测的精度。而近年来,各种基于深度学习的变化检测方法层出不穷,其中孪生网络模型在基于深度学习的变化检测方法中有着重要位置,通过合适的方法结合孪生网络中2个子网络所提取的不同时相的深度特征,可以有效提升变化检测的精度。相比于传统机器学习方法,深度学习方法可以同时提取2个时相影像的深度特征,从而更好地完成变化检测任务。

但是,在基于深度学习的遥感影像变化检测方法中,大部分都只关心某一类别的变化,也大量使用标准数据集进行模型测试,这严重限制了其应用范围。城市规划、地图更新等应用领域不仅需要关注发生变化的区域,也要关注发生变化的类型。对于多类变化检测来说,常用策略有2种: 一是分类后检测法,即对2个时相影像单独进行分类,然后直接对比分类结果,检测同一区域类型是否发生变化; 二是直接分类法,即直接训练一个模型将变化的类型直接区分开来。首先,分类后检测法完全依赖于各个时相的分类结果,只要有一个时相的分类出现错误就会导致错误的变化结果; 而直接分类法需要考虑的类别数过多,若地物有N类,则使用直接分类法需要考虑N(N-1)种变化类型,这种含有变化类型的变化样本难以获取,模型也难以训练。其次,无论上述哪一种变化检测策略,都需要较多的样本对模型进行训练,而这在实际应用中较难获取,尤其是直接分类法所需要的包含变化类型的样本。对于数据集来说,现有的大部分研究都采用了标准数据集,尽管获得了较高的检测精度,但针对标准数据集所设计的变化检测模型在面对实际应用时可能并不适用,这就需要在对模型设计和测试时使用真实场景的数据集。

本文针对上述多类变化检测存在的问题,提出了一种基于多任务学习深度孪生网络的遥感影像变化检测方法。首先,针对分类后检测法和直接分类法存在的没有考虑双时相影像相关性及需要考虑的变化类型过多的问题,本文提出了一种多任务学习法来综合分类后检测法与直接分类法,即构建一个深度学习模型同时对双时相影像进行分类和二值变化检测,最后可通过二值变化检测的结果来判断发生变化的区域和类型。其次,本文没有使用标准数据集对所提出的模型进行测试,而是使用了更符合实际应用的第三次全国国土调查(以下简称“三调”)数据,并根据“三调”数据自动挖掘出潜在的变化样本用于多任务深度孪生网络训练。

1 实验数据

本文研究区为河南省汝州市西部,使用的影像数据为“三调”所采用的高分二号影像。2景高分二号影像的获取时间分别为2019年11月和2020年6月,空间分辨率为1 m,影像大小为31 084像素×44 553像素,包含红、绿、蓝3个波段。除了影像数据之外,还使用到了“三调”的图斑数据,该图斑数据反映了2019年11月的土地利用情况。影像数据和图斑数据如图1所示。

图片

图1   本文所用数据

在图1(a)和图1(b)中,除了土地利用的变化而导致影像光谱变化外,季节变化也导致耕地、林地、草地、园地等在2景影像中的光谱表现不一致。因此,在进行变化检测时,容易产生一些误检。本文实验数据中不包含变化图斑,而只有一个时相的土地利用图斑。因此,现有的针对标准数据集所提出的各种变化检测方法是不适用的。本文提出一种基于多任务学习深度孪生网络的遥感影像变化检测方法来解决这一问题。为了检验本文所提方法进行多类变化检测的精度,人工选择了实验区域的变化图斑,包含了变化的类别信息。通过人工选择的变化图斑进行统计,发现有55.66%的图斑是由耕地变化为建设用地,有29.54%的图斑是由动土变化为建设用地,还有7.24%的图斑是由耕地变化为动土,这说明了在2019年11月—2020年6月期间,实验区有大量农田被侵占用于建设用地。

2 研究方法

2.1 技术路线

遥感影像变化检测流程如图2所示。首先,利用旧时相影像和新时相影像在特征上的差异进行非监督变化检测,得到最可能变化的区域及最可能未变化的区域,在保证这2种类型区域精度足够高的情况下将其作为二值变化检测所需的样本,同时基于旧时相样本和最可能未变化的区域可以得到新时相的样本。随后,利用所得的旧时相样本、新时相样本、二值变化样本以及旧时相影像、新时相影像训练构建好的多任务学习深度孪生网络,从而利用该网络得到新、旧时相的土地利用分类结果以及二值变化检测结果。最后,基于二值变化检测结果,可以得知哪些位置发生了变化,而基于新、旧时相的土地利用分类结果可以得知变化的类型,并且通过人工目视解译得到的地表真实变化图斑对最终变化检测结果进行精度评价。

图片

图2   遥感影像变化检测流程

2.2 面向对象的无监督变化检测

为了能够自动从影像中获取二值变化样本,并基于该二值变化样本和旧时相土地利用样本获取新时相土地利用样本,本文采用了面向对象的无监督变化检测方法。相比于基于像素的方法,面向对象的方法能够很好地保证检测出来的变化区域及未变化区域的完整性。面向对象的无监督变化检测方法基本思路是通过对比新旧时相影像对象在光谱、纹理特征上的差异。对于每一类地物来说,差异较大的影像对象被看作发生变化的影像对象,而差异较小的影像对象被看作未发生变化的影像对象。面向对象的无监督变化检测流程如图3所示。

图片

首先,新、旧时相影像在旧时相样本的约束下联合分割得到影像对象集,影像分割方法采用多分辨率分割法。随后,在影像对象的基础上分别提取新、旧时相影像对象的特征。然后,通过在特征空间上对新、旧时相影像对象特征距离的度量,得到基于影像对象的新、旧时相影像的差异。最后,对于每一类土地利用类型,差异最大的一些影像对象属于最可能变化的区域,而差异最小的一些影像对象则属于最可能未变化的区域,这2个区域构成了二值变化样本。

在整个面向对象的无监督变化检测过程中,对结果影响较大的参数有2个,即划分为最可能变化区域的阈值MLc以及划分为最可能未变化区域的阈值MLu。MLc表示每一类土地利用类型中新、旧时相影像对象差异最大的MLc%的影像对象会被认为是最可能变化的区域,MLu表示每一类土地利用类型中新、旧时相影像对象差异最小的MLu%的影像对象会被认为是最可能未变化的区域。

2.3 多任务学习深度孪生网络

本文提出的多任务学习深度孪生网络模型如图4所示。图中Conv为卷积层。基于深度学习的变化检测实际上是对变化进行语义分割,因此与大多数语义分割网络一样,本文提出的多任务学习深度孪生网络的主题也是由编码器和解码器构成。编码器采用了2个Xception为骨干网络(backbone network)构成的孪生网络分别提取新、旧2个时相影像的深度特征。Xception由进入流、中间流以及退出流3部分构成(图5)。进入流对影像进行特征的初步提取,并同时进行下采样,减小影像的空间维度。中间流则对特征进行不断的分析与过滤,并对特征进行优化。退出流则是最后对特征进行汇总和整理,完成影像深度特征的提取。相比于其他的一些骨干网络,Xception没有使用传统的卷积,而是使用了可分离卷积(separable convolution,Sep Conv),从而减少参数的数量,降低运算成本。此外,由于新、旧影像的大部分区域是未变化的,为进一步减少模型的训练参数,本文使2个Xception的权值共享。

图片

图4   多任务学习深度孪生网络结构图

图片

在解码器中首先采用了空洞空间金字塔池化(atrous spatial pyramid pooling,ASPP)对来自编码器的深度特征进行多尺度特征提取。随后,为解决由于下采样导致空间信息丢失和边界分类不准的问题,本文将ASPP所提取的多尺度特征与编码器中只进行过两次下采样的浅层特征相融合,并基于融合后的特征分别新、旧时相的土地利用进行分类。同时,利用对新、旧时相融合后的特征进一步融合,完成二值变化检测。

2.4 精度评价

常用变化检测精度评价指标为精确率(Precision)、召回率(Recall)、F1值和总体精度(overall accuracy,OA),本文还使用了Li等[30]提出的轨迹误差矩阵(trajectory error matrix,TEM)对多类变化检测结果进行精度评价。TEM可以对时序影像多类变化检测进行精度评价,但由于本文只有2个时相,因此只考虑双时相的TEM。假设双时相影像的土地利用类别数为  m,Lij为某一个影像对象在第i个时相观测到的土地利用类别标签为j,其中i取值范围为1,2,j的取值范围为1,2,…,m,则双时相影像土地利用类别总共会出现m2种变化轨迹(表1)。

表1   土地利用变化轨迹矩阵及其分组

图片

Li等将所有的变化轨迹分为6组,S1表示将未变化的样本检测为未变化且其土地利用类别也是正确的,S2表示将变化的样本检测为变化且其土地利用类别也是正确的,S3表示将未变化的样本检测为未变化但其土地利用类别是错误的,S4表示将未变化的样本检测为变化,S5表示将变化的样本检测为未变化,S6表示将变化的样本检测为变化但其土地利用类别是错误的。根据变化检测结果所属这6组的影像对象的个数,可以定义以下指标: 轨迹总体精度OAT、变化/未变化总体精度OAC/N、总体精度差异(overall accuracy difference,OAD)、单类的精度差异(accuracy difference of individual class,ADIC),其中ADIC包含了未变化类别精度差异ADICN和变化类别的精度差异ADICC,后续3个精度差异指标都反映了正确检测变化/未变化的情况下变化轨迹被正确检测的比例。

3 实验结果及分析

3.1 实验环境及参数设置

本文的多任务学习深度孪生网络基于深度学习框架Tensorflow搭建,平台硬件配置如表2所示。

表2   深度学习平台硬件配置

图片

在无监督变化检测中,使用了多分辨率分割算法在“三调”图斑的约束下对新、旧时相影像进行了联合分割,其分割尺度、紧凑度权重和光谱权重分别为70,0.5和0.9。在无监督变化检测影像对象差异度量中则选择了影像对象的均值和方差作为差异度量的特征。此外,经过多次实验,无监督变化检测中的MLc和MLu分别取值0.1和40较为合适。

在多任务学习深度孪生网络中,为了缓解GPU显存不足的问题,将实验数据裁剪为512像素×512像素的影像块用于模型的训练和预测,训练采用的批大小为4,最大迭代次数为10万,基础学习率为0.000 1。本文还对非监督变化检测所得到的有限样本进行了放大、缩小、旋转、改变影像对比度以及添加噪声等变换,以此提升模型的鲁棒性。

3.2 面向对象无监督变化检测结果分析

在“三调”图斑约束下,使用多分辨率分割算法对新、旧时相影像分割得到了392 976个影像对象,并依据“三调”图斑的类别信息从每类选择差异最大的0.1%的影像对象作为最可能发生变化的区域,选择差异最小的40%的影像对象作为最可能未发生变化的区域,最终得到变化的影像对象389个,未变化影像对象157 160个,其结果如表3所示。

表3   无监督变化检测结果

图片

由表3所示结果可知,大部分被检测为变化区域实际上确实发生了变化,而且基本上都是新建的建设用地; 也存在少量由于成像角度造成两个时相影像产生偏移而出现的变化。同时,被检测成未变化的区域也确实没有发生变化。为了进一步验证该无监督变化检测结果的精度,这里采用了精确率、召回率、F1值以及总体精度4个指标对其进行精度评价,地表真实的变化结果由人工目视解译的4 946个变化图斑构成,最终的结果表4所示。

表4   无监督变化检测精度评价结果

    

图片

由表4可知,所采用的无监督变化检测方法在本文所使用的数据集上达到了72.49%的精确率,在不使用样本的情况下这个结果比较能够接受,但召回率只有54.23%,也就是说,这个结果的误检率较低,而漏检率较高。因此,此次无监督变化检测结果无法反应地表的真实变化情况。但是在本文变化流程中,无监督变化检测只是作为一个自动选择样本的方法,而误检率较低说明了被检测为变化的对象大概率实际上也发生了变化,较高的漏检率对于样本选取来说是没有影响的,只是无法将那些漏检的变化区域作为样本而已。F1值和OA则是反映了无监督变化检测的一个总体精度情况,F1值只反映了变化区域的总体精度,而OA则反映了变化区域和未变化区域的总体精度,双时相影像大部分都没有发生变化和检测较多的未变化区域是导致OA过高的原因。总体来说,这个无监督变化检测结果基本能够满足后续进行多任务学习深度孪生网络的样本需求。

在无监督变化检测中,MLc取值0.1。主要原因是: 过高的MLc会导致变化检测的精确率过低,误检率过高,使得检测出来的变化区域难以当做后续样本使用; 而过高的MLc又会导致检测出来的变化区域过少,使得变化样本不足。与此相反,由于影像中大部分区域是没有发生变化的,未变化区域也相对较难误检,因此选择了比较大的MLu,这样也可以从旧时相样本中获取更多的新时相样本。

3.3 多任务学习深度孪生网络结果分析

依据面向对象无监督变化检测结果和“三调”图斑,完成对多任务学习深度孪生网络模型的训练,随后基于该模型完成了新、旧时相的土地利用分类和二值变化检测,将该模型的输出结果与影像对象相结合,最终得到了新、旧时相多类变化检测结果,其多类变化检测部分结果如表5所示。

表5   多类变化检测结果

图片

从表5中可以发现在2019—2020年间,实验区域发生的主要变化是从耕地到建设用地的变化。经过统计,在检测出来所有的1 399个变化图斑中,有881个变化图斑的土地利用类型都是从耕地变化到建设用地,占所有变化图斑的62.97%。为对检测出来变化图斑进行精度检验,将变化检测结果与人工目视解译得到的变化图斑进行统计并计算多类变化检测精度评价的5个指标。

统计可知,OAC/N和OAT分别达到了98.67%和77.84%,OAC/N反映的是变化/未变化的总体精度,而OAT反映了变化/未变化的检测准确率以及类别信息。OAD,ADICN和ADICC分别达到78.89%,78.90%和73.56%,说明了在被正确检测为变化/未变化的图斑中,超过3/4的图斑变化前后的土地利用类型信息也能被正确分类。

马惠1, 刘波2, 杜世宏2

1.河南省国土空间调查规划院,郑州 450016

2.北京大学遥感与地理信息系统研究所,北京 100871

摘要:

精确掌握土地覆盖/利用的变化及变化类型对国土空间规划、生态环境监测、灾害评估等有着重要意义,然而现有大部分变化检测研究主要关注二值变化检测。为此,该文首先提出了一种多任务学习深度孪生网络用于遥感影像的多类变化检测。首先提出面向对象的无监督变化检测方法,选择出新、旧时相影像中最有可能发生变化和最不可能发生变化的区域,并作为多任务学习深度孪生网络的样本; 其次,采用多任务学习深度孪生网络模型同时对新、旧时相的土地利用图以及新、旧时相的二值变化图这3个任务模型进行学习和预测; 最后,基于模型预测的新、旧时相土地利用图及新、旧时相的二值变化图获取最终的多类变化检测结果。采用第三次全国国土调查的影像数据和相应的土地利用图斑数据对多任务学习深度孪生网络模型进行了测试,结果表明所提出的方法适用于这种在没有变化、未变化样本而有历史专题图的变化检测场景中。

0 引言

人类所生存的地表环境无时无刻不在发生着变化,这些变化有些是对人类有益的,有些则是会对自然资源产生严重的破坏。因此,精确掌握这些变化十分必要。自20世纪60年代至今,遥感技术经过几十年的发展,已经可以获取高空间分辨率、高时间分辨率、高光谱分辨率和高辐射分辨率的遥感影像,利用遥感技术来对地表变化进行检测是一种行之有效的方法。目前,基于遥感的变化检测已经在城市规划、植被变化、灾害监测、地图更新和生态环境保护等多个领域得到了广泛的应用。

当前,用于变化检测的方法主要有传统机器学习方法和最新的深度学习方法。传统机器学习方法包括支撑向量机(support vector machine,SVM)、决策树、随机森林(random forest,RF)、人工神经网络(artificial neural networks,ANN)、水平集、马尔可夫随机场(Markov random field,MRF)、条件随机场(conditional random field,CRF)等,相比于早期的图像差分法、代数法、变换法等变化检测方法,这些方法显著提高了遥感变化检测的精度。而近年来,各种基于深度学习的变化检测方法层出不穷,其中孪生网络模型在基于深度学习的变化检测方法中有着重要位置,通过合适的方法结合孪生网络中2个子网络所提取的不同时相的深度特征,可以有效提升变化检测的精度。相比于传统机器学习方法,深度学习方法可以同时提取2个时相影像的深度特征,从而更好地完成变化检测任务。

但是,在基于深度学习的遥感影像变化检测方法中,大部分都只关心某一类别的变化,也大量使用标准数据集进行模型测试,这严重限制了其应用范围。城市规划、地图更新等应用领域不仅需要关注发生变化的区域,也要关注发生变化的类型。对于多类变化检测来说,常用策略有2种: 一是分类后检测法,即对2个时相影像单独进行分类,然后直接对比分类结果,检测同一区域类型是否发生变化; 二是直接分类法,即直接训练一个模型将变化的类型直接区分开来。首先,分类后检测法完全依赖于各个时相的分类结果,只要有一个时相的分类出现错误就会导致错误的变化结果; 而直接分类法需要考虑的类别数过多,若地物有N类,则使用直接分类法需要考虑N(N-1)种变化类型,这种含有变化类型的变化样本难以获取,模型也难以训练。其次,无论上述哪一种变化检测策略,都需要较多的样本对模型进行训练,而这在实际应用中较难获取,尤其是直接分类法所需要的包含变化类型的样本。对于数据集来说,现有的大部分研究都采用了标准数据集,尽管获得了较高的检测精度,但针对标准数据集所设计的变化检测模型在面对实际应用时可能并不适用,这就需要在对模型设计和测试时使用真实场景的数据集。

本文针对上述多类变化检测存在的问题,提出了一种基于多任务学习深度孪生网络的遥感影像变化检测方法。首先,针对分类后检测法和直接分类法存在的没有考虑双时相影像相关性及需要考虑的变化类型过多的问题,本文提出了一种多任务学习法来综合分类后检测法与直接分类法,即构建一个深度学习模型同时对双时相影像进行分类和二值变化检测,最后可通过二值变化检测的结果来判断发生变化的区域和类型。其次,本文没有使用标准数据集对所提出的模型进行测试,而是使用了更符合实际应用的第三次全国国土调查(以下简称“三调”)数据,并根据“三调”数据自动挖掘出潜在的变化样本用于多任务深度孪生网络训练。

1 实验数据

本文研究区为河南省汝州市西部,使用的影像数据为“三调”所采用的高分二号影像。2景高分二号影像的获取时间分别为2019年11月和2020年6月,空间分辨率为1 m,影像大小为31 084像素×44 553像素,包含红、绿、蓝3个波段。除了影像数据之外,还使用到了“三调”的图斑数据,该图斑数据反映了2019年11月的土地利用情况。影像数据和图斑数据如图1所示。

图片

图1   本文所用数据

在图1(a)和图1(b)中,除了土地利用的变化而导致影像光谱变化外,季节变化也导致耕地、林地、草地、园地等在2景影像中的光谱表现不一致。因此,在进行变化检测时,容易产生一些误检。本文实验数据中不包含变化图斑,而只有一个时相的土地利用图斑。因此,现有的针对标准数据集所提出的各种变化检测方法是不适用的。本文提出一种基于多任务学习深度孪生网络的遥感影像变化检测方法来解决这一问题。为了检验本文所提方法进行多类变化检测的精度,人工选择了实验区域的变化图斑,包含了变化的类别信息。通过人工选择的变化图斑进行统计,发现有55.66%的图斑是由耕地变化为建设用地,有29.54%的图斑是由动土变化为建设用地,还有7.24%的图斑是由耕地变化为动土,这说明了在2019年11月—2020年6月期间,实验区有大量农田被侵占用于建设用地。

2 研究方法

2.1 技术路线

遥感影像变化检测流程如图2所示。首先,利用旧时相影像和新时相影像在特征上的差异进行非监督变化检测,得到最可能变化的区域及最可能未变化的区域,在保证这2种类型区域精度足够高的情况下将其作为二值变化检测所需的样本,同时基于旧时相样本和最可能未变化的区域可以得到新时相的样本。随后,利用所得的旧时相样本、新时相样本、二值变化样本以及旧时相影像、新时相影像训练构建好的多任务学习深度孪生网络,从而利用该网络得到新、旧时相的土地利用分类结果以及二值变化检测结果。最后,基于二值变化检测结果,可以得知哪些位置发生了变化,而基于新、旧时相的土地利用分类结果可以得知变化的类型,并且通过人工目视解译得到的地表真实变化图斑对最终变化检测结果进行精度评价。

图片

图2   遥感影像变化检测流程

2.2 面向对象的无监督变化检测

为了能够自动从影像中获取二值变化样本,并基于该二值变化样本和旧时相土地利用样本获取新时相土地利用样本,本文采用了面向对象的无监督变化检测方法。相比于基于像素的方法,面向对象的方法能够很好地保证检测出来的变化区域及未变化区域的完整性。面向对象的无监督变化检测方法基本思路是通过对比新旧时相影像对象在光谱、纹理特征上的差异。对于每一类地物来说,差异较大的影像对象被看作发生变化的影像对象,而差异较小的影像对象被看作未发生变化的影像对象。面向对象的无监督变化检测流程如图3所示。

图片

首先,新、旧时相影像在旧时相样本的约束下联合分割得到影像对象集,影像分割方法采用多分辨率分割法。随后,在影像对象的基础上分别提取新、旧时相影像对象的特征。然后,通过在特征空间上对新、旧时相影像对象特征距离的度量,得到基于影像对象的新、旧时相影像的差异。最后,对于每一类土地利用类型,差异最大的一些影像对象属于最可能变化的区域,而差异最小的一些影像对象则属于最可能未变化的区域,这2个区域构成了二值变化样本。

在整个面向对象的无监督变化检测过程中,对结果影响较大的参数有2个,即划分为最可能变化区域的阈值MLc以及划分为最可能未变化区域的阈值MLu。MLc表示每一类土地利用类型中新、旧时相影像对象差异最大的MLc%的影像对象会被认为是最可能变化的区域,MLu表示每一类土地利用类型中新、旧时相影像对象差异最小的MLu%的影像对象会被认为是最可能未变化的区域。

2.3 多任务学习深度孪生网络

本文提出的多任务学习深度孪生网络模型如图4所示。图中Conv为卷积层。基于深度学习的变化检测实际上是对变化进行语义分割,因此与大多数语义分割网络一样,本文提出的多任务学习深度孪生网络的主题也是由编码器和解码器构成。编码器采用了2个Xception为骨干网络(backbone network)构成的孪生网络分别提取新、旧2个时相影像的深度特征。Xception由进入流、中间流以及退出流3部分构成(图5)。进入流对影像进行特征的初步提取,并同时进行下采样,减小影像的空间维度。中间流则对特征进行不断的分析与过滤,并对特征进行优化。退出流则是最后对特征进行汇总和整理,完成影像深度特征的提取。相比于其他的一些骨干网络,Xception没有使用传统的卷积,而是使用了可分离卷积(separable convolution,Sep Conv),从而减少参数的数量,降低运算成本。此外,由于新、旧影像的大部分区域是未变化的,为进一步减少模型的训练参数,本文使2个Xception的权值共享。

图片

图4   多任务学习深度孪生网络结构图

图片

在解码器中首先采用了空洞空间金字塔池化(atrous spatial pyramid pooling,ASPP)对来自编码器的深度特征进行多尺度特征提取。随后,为解决由于下采样导致空间信息丢失和边界分类不准的问题,本文将ASPP所提取的多尺度特征与编码器中只进行过两次下采样的浅层特征相融合,并基于融合后的特征分别新、旧时相的土地利用进行分类。同时,利用对新、旧时相融合后的特征进一步融合,完成二值变化检测。

2.4 精度评价

常用变化检测精度评价指标为精确率(Precision)、召回率(Recall)、F1值和总体精度(overall accuracy,OA),本文还使用了Li等[30]提出的轨迹误差矩阵(trajectory error matrix,TEM)对多类变化检测结果进行精度评价。TEM可以对时序影像多类变化检测进行精度评价,但由于本文只有2个时相,因此只考虑双时相的TEM。假设双时相影像的土地利用类别数为  m,Lij为某一个影像对象在第i个时相观测到的土地利用类别标签为j,其中i取值范围为1,2,j的取值范围为1,2,…,m,则双时相影像土地利用类别总共会出现m2种变化轨迹(表1)。

表1   土地利用变化轨迹矩阵及其分组

图片

Li等将所有的变化轨迹分为6组,S1表示将未变化的样本检测为未变化且其土地利用类别也是正确的,S2表示将变化的样本检测为变化且其土地利用类别也是正确的,S3表示将未变化的样本检测为未变化但其土地利用类别是错误的,S4表示将未变化的样本检测为变化,S5表示将变化的样本检测为未变化,S6表示将变化的样本检测为变化但其土地利用类别是错误的。根据变化检测结果所属这6组的影像对象的个数,可以定义以下指标: 轨迹总体精度OAT、变化/未变化总体精度OAC/N、总体精度差异(overall accuracy difference,OAD)、单类的精度差异(accuracy difference of individual class,ADIC),其中ADIC包含了未变化类别精度差异ADICN和变化类别的精度差异ADICC,后续3个精度差异指标都反映了正确检测变化/未变化的情况下变化轨迹被正确检测的比例。

3 实验结果及分析

3.1 实验环境及参数设置

本文的多任务学习深度孪生网络基于深度学习框架Tensorflow搭建,平台硬件配置如表2所示。

表2   深度学习平台硬件配置

图片

在无监督变化检测中,使用了多分辨率分割算法在“三调”图斑的约束下对新、旧时相影像进行了联合分割,其分割尺度、紧凑度权重和光谱权重分别为70,0.5和0.9。在无监督变化检测影像对象差异度量中则选择了影像对象的均值和方差作为差异度量的特征。此外,经过多次实验,无监督变化检测中的MLc和MLu分别取值0.1和40较为合适。

在多任务学习深度孪生网络中,为了缓解GPU显存不足的问题,将实验数据裁剪为512像素×512像素的影像块用于模型的训练和预测,训练采用的批大小为4,最大迭代次数为10万,基础学习率为0.000 1。本文还对非监督变化检测所得到的有限样本进行了放大、缩小、旋转、改变影像对比度以及添加噪声等变换,以此提升模型的鲁棒性。

3.2 面向对象无监督变化检测结果分析

在“三调”图斑约束下,使用多分辨率分割算法对新、旧时相影像分割得到了392 976个影像对象,并依据“三调”图斑的类别信息从每类选择差异最大的0.1%的影像对象作为最可能发生变化的区域,选择差异最小的40%的影像对象作为最可能未发生变化的区域,最终得到变化的影像对象389个,未变化影像对象157 160个,其结果如表3所示。

表3   无监督变化检测结果

图片

由表3所示结果可知,大部分被检测为变化区域实际上确实发生了变化,而且基本上都是新建的建设用地; 也存在少量由于成像角度造成两个时相影像产生偏移而出现的变化。同时,被检测成未变化的区域也确实没有发生变化。为了进一步验证该无监督变化检测结果的精度,这里采用了精确率、召回率、F1值以及总体精度4个指标对其进行精度评价,地表真实的变化结果由人工目视解译的4 946个变化图斑构成,最终的结果表4所示。

表4   无监督变化检测精度评价结果

    

图片

由表4可知,所采用的无监督变化检测方法在本文所使用的数据集上达到了72.49%的精确率,在不使用样本的情况下这个结果比较能够接受,但召回率只有54.23%,也就是说,这个结果的误检率较低,而漏检率较高。因此,此次无监督变化检测结果无法反应地表的真实变化情况。但是在本文变化流程中,无监督变化检测只是作为一个自动选择样本的方法,而误检率较低说明了被检测为变化的对象大概率实际上也发生了变化,较高的漏检率对于样本选取来说是没有影响的,只是无法将那些漏检的变化区域作为样本而已。F1值和OA则是反映了无监督变化检测的一个总体精度情况,F1值只反映了变化区域的总体精度,而OA则反映了变化区域和未变化区域的总体精度,双时相影像大部分都没有发生变化和检测较多的未变化区域是导致OA过高的原因。总体来说,这个无监督变化检测结果基本能够满足后续进行多任务学习深度孪生网络的样本需求。

在无监督变化检测中,MLc取值0.1。主要原因是: 过高的MLc会导致变化检测的精确率过低,误检率过高,使得检测出来的变化区域难以当做后续样本使用; 而过高的MLc又会导致检测出来的变化区域过少,使得变化样本不足。与此相反,由于影像中大部分区域是没有发生变化的,未变化区域也相对较难误检,因此选择了比较大的MLu,这样也可以从旧时相样本中获取更多的新时相样本。

3.3 多任务学习深度孪生网络结果分析

依据面向对象无监督变化检测结果和“三调”图斑,完成对多任务学习深度孪生网络模型的训练,随后基于该模型完成了新、旧时相的土地利用分类和二值变化检测,将该模型的输出结果与影像对象相结合,最终得到了新、旧时相多类变化检测结果,其多类变化检测部分结果如表5所示。

表5   多类变化检测结果

图片

从表5中可以发现在2019—2020年间,实验区域发生的主要变化是从耕地到建设用地的变化。经过统计,在检测出来所有的1 399个变化图斑中,有881个变化图斑的土地利用类型都是从耕地变化到建设用地,占所有变化图斑的62.97%。为对检测出来变化图斑进行精度检验,将变化检测结果与人工目视解译得到的变化图斑进行统计并计算多类变化检测精度评价的5个指标。

统计可知,OAC/N和OAT分别达到了98.67%和77.84%,OAC/N反映的是变化/未变化的总体精度,而OAT反映了变化/未变化的检测准确率以及类别信息。OAD,ADICN和ADICC分别达到78.89%,78.90%和73.56%,说明了在被正确检测为变化/未变化的图斑中,超过3/4的图斑变化前后的土地利用类型信息也能被正确分类。

4 总结与展望

针对现有变化检测研究主要聚焦于二类变化检测以及主要使用标准数据集进行模型评测的问题,本文结合“三调”的实际工程应用问题,尝试利用现有的“三调”影像数据及其图斑数据进行多类变化检测。为此,本文提出了一个多任务学习深度孪生网络模型尝试解决现有的分类后检测法和直接分类法在多类变化检测中的问题。同时为了解决多任务学习深度孪生网络模型缺乏训练样本的问题,本文结合“三调”图斑采用面向对象的无监督变化检测方法来获取最可能变化的区域以及最可能未变化的区域,并以此从“三调”图斑中提取新时相影像土地利用样本及新、旧时相的变化、未变化样本。

从实验结果来看,本文所提的方法适用于在没有变化、未变化样本而有历史专题图的变化检测场景中,典型的应用场景有地图更新、国土资源监测等等。虽然现有的变化检测精度还达不到实际的工程应用需求,但通过与人工判读相结合的手段,可以大幅度提高作业效率。

                                                                   (原文有删减)

作者简介】 马 惠(1980-),女,高级工程师,主要从事地籍调查、土地资源调查遥感监测技术方法研究。

Email: 42879575@qq.com。

基金资助】国家重点研发计划-政府间国际创新合作“时空大数据驱动的可持续发展城市人居环境监测评估与应用示范”(2021YFE0117100)

引文文本】马惠, 刘波, 杜世宏. 多任务学习孪生网络的遥感影像多类变化检测[J]. 自然资源遥感, 2024, 36(1): 77-85.

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/798486.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

渲染一帧特效需要多少钱?云渲染特效每帧成本

特效渲染的成本受到诸多因素的影响,每帧的渲染费用是评估整个项目预算的重要依据。随着云渲染技术的发展,其高效率和可伸缩性赢得了业界的广泛关注。对于影视制作公司和独立创作者而言,掌握云渲染特效的单帧成本是管理和优化预算分配的关键。…

PCL 点到三角形的距离(3D)

文章目录 一、简介二、实现代码三、实现效果参考资料一、简介 给定三角形ABC和点P,设Q为描述ABC上离P最近的点。求Q的一个方法:如果P在ABC内,那么P的正交投影点就是离P最近的点Q。如果P投影在ABC之外,最近的点则必须位于它的一条边上。在这种情况下,Q可以通过计算线段AB、…

算法:计数类dp

文章目录 一、举个栗子例子1:爬楼梯问题例子2:不同路径例子3:计数子序列 二、基本思路三、典型例题一、ACWing:900. 整数划分1、解法一1.1、状态转移方程1.2、参考代码 O(n) 超时 2、解法二:类似完全背包问题1.1、状态…

博客部署002-centos安装nginx

1、centos 如何安装nginx? 在CentOS系统上安装Nginx的过程相对直接,通常可以通过系统自带的Yum包管理器来安装。以下是安装Nginx的最新稳定版的步骤: 1.1 更新系统软件包 在安装Nginx之前,首先确保系统软件包是最新的,运行…

如何使用GraphQL和Apollo构建一个宝可梦应用

宝可梦是一个由视频游戏、动画系列与电影、交换卡牌游戏以及其他相关媒体组成的日本媒体特许经营权。 在本文中,我们将使用一个宝可梦GraphQL API,该API提供有关不同宝可梦的数据。 我们将使用Apollo和GraphQL来处理数据获取,以及React来构…

谨慎使用通过光纤传输的HDMI光纤线,存严重缺陷

严重缺陷: 1.只能单向传输 只能单向传输,从一端到另一端,和二极管一样,只能单向传输信号。某些情况你需要变更传输方向时,你将欲哭无泪.传统的HDMI线,不带放大器的,都可以双向传输.网上搜索布…

Vue3【进阶】

简介 https://cn.vuejs.org/guide/introduction.html 创建vue3工程 【基于 vue-cli创建】 基本和vue-cli的过程类似,只是选择的时候用vue3创建 【基于vite创建】【推荐】 【官网】https://vitejs.cn/ 【可以先去学一下webpack】 步骤 【https://cn.vitejs.…

#QT项目实战(天气预报)

1.IDE:QTCreator 2.实验: 3.记录: (1)调用API的Url a.调用API获取IP whois.pconline.com.cn/ipJson.jsp?iphttp://whois.pconline.com.cn/ipJson.jsp?ip if(window.IPCallBack) {IPCallBack({"ip":&quo…

华为海思2024春招数字芯片岗机试题(共9套)

huawei海思2024春招数字芯片岗机试题(共9套)(WX:didadidadidida313,加我备注:CSDN huawei数字题目,谢绝白嫖哈) 题目包含数字集成电路、System Verilog、Verilog2001、半导体制造技术、高级ASIC芯片综合、…

Java实现二叉树(上)

1.树型结构 1.1树型结构的概念 树是一种 非线性 的数据结构,它是由 n ( n>0 )个有限结点组成一个具有层次关系的集合。 把它叫做树是因为它看 起来像一棵倒挂的树,也就是说它是根朝上,而叶朝下的 1.2树型结构的特点…

二 maven构建项目

一 Maven的GAVP Maven工程相对之前的工程,多出一组gavp属性,gav需要我们在创建项目的时指定,p有默认值,后期通过配置文件修改。 GAVP是指 GroupId、ArtifactId、Version、Packaging 等四个属性的缩写,其中前三个是必…

c++的学习之路:14、list(1)

本章讲一下如何使用list,代码在文章末 目录 一、list介绍 二、增 三、删 四、查和改 五、交换 六、代码 一、list介绍 首先还是看一看官方文档的介绍如下图,如下方五点: 1. list是可以在常数范围内在任意位置进行插入和删除的序列式…

element-ui result 组件源码分享

今日简单分享 result 组件的源码实现,主要从以下三个方面: 1、result 组件页面结构 2、result 组件属性 3、result 组件 slot 一、result 组件页面结构 二、result 组件属性 2.1 title 属性,标题,类型 string,无默…

网络基础三——初识IP协议

网络基础三 ​ 数据通过应用层、传输层将数据传输到了网络层; ​ 传输层协议,如:TCP协议提供可靠性策略或者高效性策略,UDP提供实时性策略,保证向下层交付的数据是符合要求的的;而网络层,如&a…

【动态规划-状态压缩dp】【蓝桥杯备考训练】:毕业旅行问题、蒙德里安的梦想、最短Hamilton路径、国际象棋、小国王【已更新完成】

目录 1、毕业旅行问题(今日头条2019笔试题) 2、蒙德里安的梦想(算法竞赛进阶指南) 3、最短Hamilton路径(《算法竞赛进阶指南》&模板) 4、国际象棋(第十二届蓝桥杯省赛第二场C A组/B组&#…

Java初始——IDEA-web的启动

Tomcat 文件夹作用 bin 启动 关闭的脚本文件 conf 配置 lib 依赖的jar包 logs 日志 temp 临时文件 webapps 存放的网站 Maven 1.在javaweb中,需要使用大量的jar包,手动导入 2.Maven 架构管理工具 核心:约定大于配置 必须按照规则 web idea-we…

2024.4.7

1. 2列火车 #include<myhead.h>pthread_mutex_t m1; pthread_mutex_t m2;void* run(void* arg) {while(1){pthread_mutex_lock(&m1);printf("火车B进入\n");printf("A请等待\n");pthread_mutex_unlock(&m2);sleep(2);} }int main(in…

开发项目接单报价快速计算,报价量化程序

定制化开发&#xff0c;如何计算项目预算&#xff0c;是程序开发者头疼的一个问题。 项目费用谈得过低&#xff0c;就天天加班累死赚不到钱&#xff1b;谈得过高&#xff0c;会导致顾客流失&#xff0c;信誉受损。 项目费用量化可见是多么重要。 下面是一段量化的程序&#…

跟TED演讲学英文:AI isn‘t the problem — it‘s the solution by Andrew Ng

TED英文文稿 文章目录 TED英文文稿AI isnt the problem — its the solutionIntroductionVocabularyTranscriptSummary 2024年4月6日学习吴恩达的这篇演讲 AI isn’t the problem — it’s the solution Link: AI isn’t the problem — it’s the solution Speaker: Andrew …

C语言进阶课程学习记录-第21课 - 宏定义与使用分析

C语言进阶课程学习记录-第21课 - 宏定义与使用分析 宏定义的本质实验-字面量比较宏定义表达式实验-表达式有效性宏的作用域实验-作用域分析内置宏内置宏演示小结 本文学习自狄泰软件学院 唐佐林老师的 C语言进阶课程&#xff0c;图片全部来源于课程PPT&#xff0c;仅用于个人学…