服务器数据恢复环境:
昆腾某型号存储,StorNext文件存储系统。
共有9个分别配置了24块磁盘的磁盘柜,其中8个磁盘柜存放普通数据,1个磁盘柜存放元数据。
存放元数据的磁盘柜中的24块磁盘组建了8组RAID1阵列和1组4盘RAID10阵列,还有4个全局热备硬盘。
存放普通数据的磁盘柜中的192块磁盘共组建了32组6盘RAID5阵列,32组RAID5阵列分为2个存储系统。
服务器故障:
存放普通数据的其中一个存储系统中的一组RAID5阵列有2块硬盘先后出现故障离线,该RAID5阵列不可用,从而导致该阵列所在的存储系统崩溃,无法使用。
昆腾存储及StorNext文件系统架构:
注:Meta_LUN(元数据卷)) Data_LUN(用户数据卷)
服务器数据恢复过程:
1、将磁盘柜中出现故障的raid5阵列中的所有磁盘编号后取出,由硬件工程师进行检测,除了发现其中一块离线硬盘存在大量的坏道,没有发现其他磁盘存在明显的硬件故障。将完好的硬盘以只读方式进行扇区级的全盘镜像,镜像完成后将所有磁盘按照编号还原到原磁盘柜中。后续的数据分析和数据恢复操作都基于镜像文件进行,避免对原始磁盘数据造成二次破坏。
针对存在大量的坏道的磁盘,由硬件工程师开盘更换固件,更换固件能正常读取后使用专业工具进行修复,虽然坏道仍然存在,但是可以备份。
部分镜像文件:
2、基于镜像文件对故障RAID5阵列底层数据进行分析,获取到该RAID5相关信息,利用获取到的信息虚拟重组RAID5阵列,重组完成后将RAID5阵列中的LUN恢复成镜像文件。在分析过程中,发现损坏较严重的硬盘为后离线的硬盘,就是此硬盘存在大量坏道。
3、登录昆腾存储设备的管理界面,获取到StorNext文件系统中和卷相关的一些基本信息。
4、分析StorNext文件系统中的Meta卷和Data卷,经过分析发现该StorNext文件系统包含2个Data卷,每一个完整的Data卷是由多组RAID阵列中的LUN组成的,通过分析这些LUN,北亚企安数据恢复工程师研究出LUN之间组合的算法规律,然后虚拟重组出完整的Data卷。
5、分析Meta卷中的节点信息、目录项信息、Meta卷和Data卷之间的对应关系,针对一个Meta卷管理多个Data卷的情况,北亚企安数据恢复工程师研究出Meta卷到Data卷的索引算法。
文件节点:
目录块:
6、通过上述步骤的分析&研究,获取到了数据恢复工作所需要的全部信息。北亚企安数据恢复工程师编写程序扫描Meta卷中的节点信息和目录项信息,通过解析目录项和节点获取完整的文件系统目录结构。解析每一个节点中的指针信息并将这些信息记录在数据库中。
文件信息:
7、北亚企安数据恢复工程师编写文件提取程序读取数据库,根据解析出的信息以及两个Data卷之间的聚合算法提取数据。
8、随机抽样检测提取出来的数据,没有发现任何问题。由用户方工程师对恢复出来的数据进行验证,验证完成后用户方认可恢复结果。
9、将恢复出来的数据迁移到用户方准备好的环境中,再次验证没有问题。本次数据恢复工作完成。