服务器数据恢复环境:
P740+AIX+Sybase+V7000存储,存储阵列柜上共12块SAS机械硬盘(其中一块为热备盘)。
服务器故障:
存储阵列柜中有磁盘出现故障,工作人员发现后更换磁盘,新更换的磁盘数据同步到40%左右时,阵列柜中的另一块磁盘也出现问题,数据同步中断,逻辑盘无法挂接到小型机上,业务中断。存储的管理界面显示2块硬盘故障脱机。
阵列柜中的磁盘共组建了2组Mdisk,加到一个pool中。现在主要数据pool无法加载,有3个通用卷无法挂载。
服务器数据恢复过程:
1、将故障存储中所有磁盘编号后取出,以只读方式给正常的磁盘做全盘镜像。针对故障硬盘,使用专业工具处理后做全盘镜像。镜像完成后将所有磁盘按照编号还原到原存储中,后续的数据分析和数据恢复都基于镜像文件进行,避免对原始磁盘数据造成二次破坏。
2、基于镜像文件分析出存储中故障硬盘的离线顺序,对后离线的故障硬盘进行修复。
3、尝试将修复完成的故障硬盘插回存储,进行强制上线的操作。
4、根据用户方提供的部分配置信息,将硬盘按照Mdisk组进行分类。
5、分析每一组Mdisk中的所有硬盘,获取到raid相关信息&虚拟重组Mdisk。
6、通过分析Mdisk获取到pool的相关信息,解析pool在Mdisk上的分布情况,分析pool中的条带大小。
7、解析LUN位图,分析各LUN在pool中的分布情况。
8、北亚企安数据恢复工程师编写程序提取LUN。
9、对提取出来的数据进行随机抽样检测,没有发现问题。
移交服务器数据:
在用户方提供的存储设备上创建与原环境大小和数量一致的LUN,将提取出的数据LUN的镜像文件通过dd的方式复制到存储上创建的LUN中。用户方工程师重新配置存储环境,经过检查数据正常。本次数据恢复工作完成。