服务器存储数据恢复环境:
EMC某型号存储,8块组建一组raid5磁盘阵列。上层操作系统采用zfs文件系统。
服务器存储故障&分析:
raid5阵列中有2块硬盘未知原因离线,raid5阵列崩溃,上层应用无法正常使用。
服务器数据恢复过程:
1、将故障服务器存储内的所有硬盘编号后取出,由硬件工程师检测所有磁盘是否存在硬件故障,经过检测没有发现有硬盘(包括两块掉线硬盘)存在物理故障。将所有磁盘以只读方式进行扇区级别的全盘镜像,镜像完成后将所有磁盘按照编号还原到原存储中。后续的数据分析和数据恢复操作都基于镜像文件进行,避免对原始磁盘数据造成二次破坏。
2、基于镜像文件分析底层数据,通过计算获取服务器raid5阵列的硬盘盘序、raid条带大小和其他raid阵列相关信息,利用获取到的raid相关信息重组raid5阵列。
3、由于该型号EMC存储中LUN是基于RAID的。raid5阵列重组出来后,北亚企安数据恢复工程师分析LUN在RAID阵列中的分配信息&LUN分配的数据块MAP。因为底层只有一个LUN,所以只需要分析一份LUN的信息即可。
4、根据分析出的LUN信息,使用北亚企安自主研发的程序解释LUN的数据MAP&导出LUN的所有数据。
5、对导出的lun进行文件系统解释,但是在文件系统解释过程中报错。分析报错内容并对文件系统解释程序进行调试,经过分析确认导致zfs文件系统解释过程中报错的原因是该存储中某些元文件损坏。北亚企安数据恢复工程师手动修复这些损坏的文件,直到可以完全正常解析zfs文件系统。
6、完成zfs文件系统的修复和解析后,验证恢复出来的数据没有发现问题。让用户方工程师对恢复出来的数据进行验证,经过反复验证,用户方工程师确认恢复数据完整有效。本次数据恢复工作完成。