服务器数据恢复环境:
某研究院一台DELL存储,15块硬盘搭建的一组RAID5磁盘阵列。
该RAID5阵列只有一个卷组,该卷组占用了阵列的全部空间;该卷组只有一个起始位置为0扇区的XFS裸分区。
服务器故障&初检&分析:
该RAID5阵列中有一块硬盘由于未知原因离线,工作人员更换新硬盘,在RAID阵列进行数据同步的过程中,阵列中又有一块磁盘指示灯报警,磁盘离线,同步失败,阵列无法正常工作。
北亚企安数据恢复工程师拿到故障存储后,将存储中所有磁盘编号取出做硬件故障检测。初步检测结果:最先离线的硬盘访问速度异常缓慢,后离线的磁盘有少量坏扇区,其他磁盘没有发现明显物理故障。
因为RAID5磁盘阵列只支持一块硬盘离线时的冗余保护,如果有第二块磁盘离线,阵列便无法正常工作。根据用户描述,该RAID5阵列崩溃的主要是由在同步过程中离线的第二块磁盘造成,所以第二块磁盘的处理是关键。
服务器数据恢复过程:
1、将所有完好硬盘做只读镜像的备份,用专业工具对第二块离线硬盘做备份。备份完成后将所有磁盘按照编号还原到原存储中,后续的数据分析和数据恢复操作都基于镜像文件进行,避免对原始数据造成二次破坏。
2、对15块硬盘的镜像文件进行异或测试,测试全部通过,没有发现错误。
3、北亚企安数据恢复工程师计算第二块离线硬盘损坏扇区位置的数据,并将其写入到镜像文件。
4、根据备份过程中分析出来的原RAID5结构信息虚拟重构RAID阵列,验证RAID结构的正确性。
5、将第二块离线磁盘的镜像备份到新硬盘,将该新硬盘强制上线。更换第一块离线磁盘,并对其进行同步。
6、同步完成后,由用户方工程师对恢复出来的数据进行检测。经过检测,目录结构完整,重要文档完好,FSCK无任何错误提示,用户方确认恢复数据完整可用,认可恢复结果。
7、将恢复出来的数据迁移到用户方准备好的环境中。本次数据恢复工作完成。
服务器数据恢复结论:
异或测试通过表明该存储发生故障后没有新的数据写入或结构有过改动。
根据其他几块完好的硬盘数据计算出坏硬盘对应位置的数据。