学术简报
题目:Comparison of Long Short Term Memory Networks and the Hydrological Model in Runoff Simulation作者:Hailin You1,Hongxiang Fan2,Ligang Xu2,Yongmi Wu1,*,Lizhen Liu2 and Zhong Yao1
作者单位:
1 Poyang Lake Research Center, Jiangxi Academy of Sciences, Nanchang 330096, Jiangxi, China; youhailin1985@163.com (H.Y.); woliulizhen2007@126.com (L.L.); readnature@163.com (Z.Y.)
2 Key Laboratory of Watershed Geographic Sciences, Nanjing Institute of Geography and Limnology, Chinese Academy of Sciences, Nanjing 21008, Jiangsu, China; fanhongxiang13@mails.ucas.ac.cn (H.F.); lgxu@niglas.ac.cn (L.X.)
* Correspondence: wuyongming@jxas.ac.cn
期刊/日期:Water/8 January 2020
文案:郭东淏排版:郭东淏校核:杨苑Part.1
研究背景
水文研究中模拟径流的方法可分为三大类:(1)概念模型,使用概念组成模型径流;(2)物理模型,代表实际的产流过程;(3)数据驱动方法,从输入变量中估算径流。由于模型结构和参数估计的不确定性,物理模型十分依赖模型的校准。如需实现水文或水动力过程的精确模拟,则需要依赖强大的计算能力,所以此方法仅限于模拟持续时间较短的水文过程。以往的研究证明了多元线性回归(MLR)、支持向量机(SVM)和人工神经网络(ANN)等数据驱动的方法在水文应用中的可行性。与传统物理模型相比,深度学习方法可以获得相当甚至更好的结果。其中长短期记忆人工神经网络(Long Short-Term Memory,LSTM)在水文模拟、土壤水分预测、降雨径流模拟等方面都有不错的效果。
Part.2
研究目的
该研究将建立一个LSTM神经网络,用降水资料和其他气象资料对其进行训练,并与传统的水文模型和人工神经网络模型进行比较。该研究的目的是:
1、分析窗口尺寸对模拟性能的影响。给定一个时间序列数据集,模型使用前一个时间步长作为输入变量,下一个时间步长作为输出变量。前一个的时间步长称为窗口尺寸(Windows Size)。
2、 用仅包含降水量的数据集和包含所有可用气象变量的数据集作为输入数据集分别训练模型,分析在LSTM模型中输入更多的气象变量是否可以提高模拟性能;
3、 比较LSTM模型与其他模型的模拟能力。
图1 鄱阳湖流域的地形与河网(A)。7个水文站和13个气象站的位置分别用红三角和蓝点表示
Part.3
研究方法
1、 数据归一化。数据归一化是大多数神经网络的一般要求。对所有气象和水文数据采用零均值归一化可以确保数据保持在同一尺度上,进一步保证模型可以快速稳定地收敛。
2、 LSTM是一种递归神经网络(RNN)的特殊类型,它避免了RNN不能准确地提取过去的特征信息的特点。该研究开发的LSTM神经网络模型包含3层,共有128个LSTM神经元。输出层产生5组不同的径流时间序列。训练周期为2002年至2008年,测试周期为2009年至2013年。
图2 该研究提出的LSTM模型结构
3、 该研究实现了一个标准的三层前馈网络的ANN模型。其隐藏层包含双曲正切sigmoid传递函数,输出层包含线性传递函数,其他设置均与LSTM相同。
图3 该研究的ANN结构
4、 该研究将揭示从短时期到长时期的窗口大小(几天到半年)对模型的影响。受限于计算能力,该研究窗口设置为1、5、10、15、20、25、30、60、90和180天。气象变量对径流产生的日和周影响可以用1到25天的窗口来表示,月影响可以用30天的窗口说明,年际气候变化的影响可以用60天、90天和180天的窗口说明。然后选择产生最佳模型性能的窗口尺寸以供进一步应用。
5、 为了比较LSTM与传统分布式水文模型的性能,该研究利用土壤水评价工具(SWAT)建立了鄱阳湖流域径流模拟模型。该模型对2002–2008年期间的每日观测径流对模拟径流进行了训练,并用2009–2013年的数据进行验证。
图4 鄱阳湖流域特征:(A)土壤类型;(B)土地利用;(C)水文响应单元
6、 模型性能的评价指标是均方根误差(RMSE)和纳什效率系数(NSE)。
Part.4
研究结果
图5 不同窗口大小下的模型性能。(A)RMSE;(B)NSE
该研究分析了窗口尺寸对模型性能的影响。如图5所示,随着窗口尺寸的增加,RMSE出现了先减小后增加的趋势。最小的RMSE和最大的NSE都是在窗口为15时获得的,这表明15天的窗口可能是模拟鄱阳湖流域径流的最佳选择。
表1 LSTM模型在训练和测试期间的总体性能统计结果
如表1所示,LSTM在训练期表现良好,降水数据集LSTM1和气象数据集LSTM2的平均NSE分别为0.86和0.90。尽管在训练期LSTM1和LSTM2趋势大致相同,但在测试期,两种模型的性能差异是显著的。在测试期,修水子流域LSTM2的NSE为0.74,而LSTM1的NSE仅为0.60,说明气象资料可以改善模型的性能。
图6 测试期内所有五个子流域的LSTM1表现
图7 测试期内所有五个子流域的LSTM2表现
图6和图7显示了来自LSTM模型的实测和模拟径流。如图所示,LSTM1和LSTM2都能很好地模拟整个测试期内的径流模式。但是当径流量相对较低时,LSTM1往往明显高估了径流的变化,并低估了峰值径流的值。与LSTM1相比,修水子流域LSTM2的性能要好得多,峰值更准确。
图8 LSTM、ANN和SWAT模型在径流模拟中的应用
在模拟性能方面,LSTM生成的时间序列与传统的ANN和SWAT相比均表现出了良好的结果。如图8所示,与传统的ANN和SWAT模型相比,在整个测试期间,LSTM2在所有子流域的RMSE最低,NSE最高。虽然LSTM模型对修水子流域的径流模拟存在一定的困难,但在输入更多气象变量时,LSTM的NSE值升高了23%。除修水流域外,传统的ANN与SWAT模型表现相当甚至优于SWAT模型。然而在修水子流域,传统的神经网络模型的性能明显下降,NSE值低于0.40。
Part.5
研究结论
该研究提出了一种使用最先进的LSTM网络的数据驱动方法,将所提出的模型用于鄱阳湖流域。该研究检验了窗口尺寸和输入数据集对LSTM模型模拟精度的影响,并与ANN和SWAT进行了比较。从该研究的结果可以得出以下结论:
1、 LSTM模型的性能受窗口尺寸的影响十分强烈。对研究区而言,15天的窗口尺寸比较稳定。
2、 当以降水资料为唯一输入时,所提出的LSTM1模式可取得理想的结果(NSE在测试期间的范围为0.60至0.92)。通过向模型输入更多的气象变量(NSE在试验期间的变化范围为0.74~0.94)时,可以提高模型的性能。
3、 该研究所提出的LSTM模型与人工神经网络(ANN)和SWAT模型相比,在大多数情况下,即使是在气象台站稀少的地区也取得了不错的效果。因此,基于数据建模的LSTM及其进一步的发展在径流模拟领域中具有较大的潜力。
原文链接
https://www.mdpi.com/2073-4441/12/1/175
你在看这篇文章吗?