实验所用 TE 仿真过程的数据集是网上公开的数据集,该数据集中的训练集和测试集分别包含 20 种故障工况和一种正常工况数据,其中所采集的每个样本信号包含 41 个测量变量和 11 个控制变量,所以每个时刻采集到的样本有 52 个观测变量。
TE 仿真实验过程中每隔 3 分钟采集一组样本,训练集样本收集过程中每种工况的仿真时间为 25 小时,刚开始系统正常运行 1 小时,然后引入故障,正常样本是由系统在无干扰的情况下运行 25 小时采集的,每种工况分别在 500 种不同随机数下进行仿真实验,采集到的训练集数据中每种工况共有 250000 个样本;测试集样本收集过程中每种工况运行的时间为 48 小时,加干扰的实验中前 8 个小时系统是正常运行,之后开始引入故障,同样每种工况分别在 500 种不同随机数下进行仿真实验,采集到的测试集数据中每种工况共有 480000 个样本。
TE 过程是复杂、强耦合的化工过程,TE 过程产生的数据具有非线性、高维、非平稳分布、时序性等特点。目前,基于深度学习对于 TE 过程的故障诊断技术研究工作大部分是基于自动编码器及自动编码器的改进算法,虽然相较于传统数据驱动方法,其更适用于对复杂非线性、高维度化工过程数据的研究,但是,这些方法对于具有时间序列关系数据的分析表现并不是很理想,很难提取出数据中时序相关性的信息。由于故障的演变是一个持续的过程,当前时刻的化工过程运行状态与前面时刻过程状态有很强的相关性。因此,充分挖掘数据之间的时序关系对故障诊断技术的研究有很大的帮助。
鉴于此,采用长短时记忆网络LSTM的TE过程故障诊断,运行环境为MATLAB R2021B。
function processed = helperPreprocess(mydata,limit)H = size(mydata);processed = {};for ind = 1:limit:Hx = mydata(ind:(ind+(limit-1)),4:end);processed = [processed; x'];end
end通过知乎学术咨询获取代码:
https://www.zhihu.com/consult/people/792359672131756032?isMe=1
擅长领域:现代信号处理,机器学习,深度学习,数字孪生,时间序列分析,设备缺陷检测、设备异常检测、设备智能故障诊断与健康管理PHM等。