数据集介绍
在开始介绍数据集之前,先帮大家理清一下涡扇发动机的数据(NASA提供,本文中称为数据集A)和PHM2008竞赛数据(本文称为数据集B)的关系。之所以将数据集A和数据集B放在一篇文章中,是因为数据集A和数据集B都是利用MATLAB所搭建的航空发动机Simulink模型搭建的。换句话说,它们的试验平台是一致的,但是其输入是存在差异的,具体可查看参考文献1和2。借用文献2中关于数据的介绍,数据集A和数据集B之间的联系如下表所示:
数据集 | 故障模式 | 条件 | 训练样本 | 测试样本 | |
数据集A | #1 | 1 | 1 | 100 | 100 |
#2 | 1 | 6 | 260 | 259 | |
#3 | 2 | 1 | 100 | 100 | |
#4 | 2 | 6 | 249 | 248 | |
数据集B | #5T | 1 | 6 | 218 | 218 |
#5V | 1 | 6 | 218 | 435 |
从上表中能发现,数据集A由4个不同故障模式、不同条件的涡扇发动机数据集组成,而数据集B是由2个涡扇发动机数据集组成,这些涡扇发动机数据其实是相似的,仅仅是由于其条件和故障模式不同而已。值得注意的是,数据集A中#1、#2、#3都是#4的特殊情况,即#4是最复杂的情况,故障模式多并且条件多。对比数据集A,数据集B并没有给出测试样本的剩余寿命值,这是其重要差异。数据集B中#5v的435个测试样本是用于最终不同选手模型的打分所用的,其也缺乏寿命预测真值。在比赛中,选手通过上传自己的模型RUL,来获得最终打分。**因此,在我看来,数据集A是完整的,可以全部使用,而数据集B则仅只有#5T的训练样本可以使用**,数据集B的其他数据缺乏RUL真值,因此我们并不知道,无法在论文实验中使用。**综上所述,数据集B的价值不大,因此本篇文章主要解读数据集A。**
涡扇发动机仿真数据
试验说明
数据
数据集A即C-MAPSS模拟数据,该数据是模拟大型商用涡扇发动机的数据, 发动机简图如上图所示。该数据的代码采用了MATLAB及其Simulink模块。该模型的详细细节参考文献1。
2023
数据解读
data
数据集A网址:
https://data.nasa.gov/Aerospace/CMAPSS-Jet-Engine-Simulated-Data/ff5v-kuh6
数据集A和B的网址(NASA):
https://www.nasa.gov/content/prognostics-center-of-excellence-data-set-repository
01
所有数据均为txt文件,文件数量不多,大家可以手动读取,利用MATLAB“主页”菜单下的“导入数据”进行自行读取,不懂得大家可以百度。
02
文件分为三类:训练数据 train_FD00x.txt ;测试数据test_FD00x.txt,以及测试数据每个样本最后时刻时,其涡扇发动机的剩余使用寿命,对应文件RUL_FD00x.txt。(x可以为1、2、3,4,x取值不同,即改涡扇发动机的故障模式和条件不同)
03
训练数据 train_FD00x.txt与测试数据test_FD00x.txt内容想类似,其均为nX26的数值矩阵。该矩阵n表示不同样本的不同循环周期(循环周期可以理解成时间),26维度分别对应样本编号、时间循环、操作1、操作2、操作3、传感器1、传感器2、…、传感器21。该矩阵从第一行到后,先是第一个样本的不同时刻的操作和传感器输出,然后是第二样本的,直至所有样本的。
04
剩余寿命预测数据RUL_FD00x.txt其大小为max(样本编号)X1,比如FD001数据集有100个样本,那么其RUL_FD001.txt的大小为100X1。该数据的含义为第i个样本的最后监测时刻其对应的剩余寿命预测值。
05
数据集A网址:
https://data.nasa.gov/Aerospace/CMAPSS-Jet-Engine-Simulated-Data/ff5v-kuh6
数据集A和B的网址(NASA):
https://www.nasa.gov/content/prognostics-center-of-excellence-data-set-repository
关注公众号“滚动轴承故障诊断与寿命预测”,每天进步一点点。
参考文献
[1] Saxena A, Goebel K, Simon D, et al. Damage propagation modeling for aircraft engine run-to-failure simulation[C]//2008 international conference on prognostics and health management. IEEE, 2008: 1-9.
[2] Ramasso E, Saxena A. Performance Benchmarking and Analysis of Prognostic Methods for CMAPSS Datasets[J]. International Journal of Prognostics and Health Management, 2014, 5(2): 1-15.
[3] Wang T, Yu J, Siegel D, et al. A similarity-based prognostics approach for remaining useful life estimation of engineered systems[C]//2008 international conference on prognostics and health management. IEEE, 2008: 1-6.
[4] Heimes F O. Recurrent neural networks for remaining useful life estimation[C]//2008 international conference on prognostics and health management. IEEE, 2008: 1-6.
[5] Peel L. Data driven prognostics using a Kalman filter ensemble of neural network models[C]//2008 international conference on prognostics and health management. IEEE, 2008: 1-6.