为了在基于过程的模型中准确表示边坡稳定性,有必要包含大量涉及滑坡几何形状和内部结构的局部特征的特征。这包括但不限于斜坡的分层和不连续性、运动裂缝、裂片、陡坡、地垒/地堑结构、降雨、空气和土壤温度、土壤水分含量、许多点的地下水位、地表和深度但是,获取所有这些必要信息很麻烦,因此,这些模型被称为特定地点模型,因为它们主要关注单个滑坡或小区域。
然而,到目前为止,由于复杂的自然环境,使用的滑坡敏感性和划定方法的预测准确性仍然是一项具有挑战性的任务
机器学习 (ML) 算法展示了以高精度解决非线性现实世界问题的有前途和有效的方法
最近,ML 中的集成方法在各个领域引起了广泛关注,特别是在计算地球科学中,因为它们可以从一组分类器中构建学习器,以在许多现实世界的任务中以显着的准确度处理复杂和高维数据(Dietterich 2000 ; 周2014)。由于以下原因,构建“适当”的集成是很有可能的:
(1)集成算法能够平均投票并减少选择不正确分类器的风险;
(2)通过从许多不同的初始点执行局部搜索构建的集成可能比任何单个分类器都可以提供对手头目标函数的改进近似;
(3)他们能够扩展目标函数的空间。然而,检查 LSM 的多集成框架是有限的,并且它们的性能正在评估中
计算步骤和方法的工作流程如图5所示,主要涉及三个步骤:
(1)使用事后航拍照片和现场再生准备滑坡清单;
(2) 研究多重共线性分析,估计滑坡诱发因素的等级,并通过应用多个集成机器学习 (ML) 模型(bagging、boosting 和 stacking)生成 LSM 图;
(3) 比较和验证每个模型的性能。以下流程图详细描述了整个过程
Flowchart of the methodology followed in this study本研究采用的方法流程图
迄今为止,对于诱发因素的选择尚无正常规律或普遍共识。坡度、坡向、岩性、平面曲率和排水密度是最广泛使用的诱发因素,诱发因素应根据滑坡的触发机制、滑坡类型、案例研究区域的特征、可用的数据集和使用的模型
。13个诱发因素,即高程(DEM)、坡度、坡向、平面曲率、剖面曲率、总曲率、排水密度、到排水管网的距离、河流功率指数(SPI)、地形位置指数(TPI)、土地利用、累积根据以往的文献。高程、坡度、坡向、曲率、平面曲率、剖面曲率等形态参数是在ArcGIS 10.5软件中从10 m的数字高程模型(DEM)中提取的。
地形位置指数 (TPI) 因子,也称为相对地形位置,是一种地形崎岖度测量值和当地高程指数。。TPI指数对于识别景观格局和边界非常有用,与岩石类型、主导地貌过程、土壤特征、植被等相对应。将最终输出的栅格分类为山脊、上坡、中坡、平坡、下坡, 和使用自然休息的山谷。
为了检查水文相关因素的影响,考虑到排水管网的距离和排水密度。到排水管网的距离和排水密度分别通过 ArcGIS 10.5 软件中的欧几里得距离和线密度工具计算。
人们普遍认为,近坡面的积水会通过改变土壤材料的重量和重力势能来影响山坡的强度。为了将这种可变性整合到滑坡模型中,提取了复合地形指数(CTI)作为潜在土壤湿度的替代物
多重共线性分析
方差膨胀因子 (VIF) 和容差 (TOL) ,如果 VIF 值大于 10 或公差值小于 0.1,则表明诱发因素存在多重共线性问题
使用集成 ML 方法的模型的整体准确性可以通过因子选择来提高,因为数据集中的某些因子可能会产生噪声,从而降低模型的整体预测能力。因此,有必要检查和消除具有低或无效预测能力的诱发因素。