存储数据恢复环境:
某单位一台存储,1个机头+4个扩展柜,有两组分别由27块和23块硬盘组建的RAID5阵列。其中由27块磁盘组建的那一组RAID5阵列崩溃,这组RAID5阵列存放是Oracle数据库文件。存储系统上层共划分了11个卷。
存储故障&检测:
存储内磁盘发生故障,存储设备上有两块盘的硬盘指示灯显示黄色,存储不可用,存储设备已经过保。
硬件工程师将故障存储中那组出现故障崩溃的阵列中所有磁盘编号后取出,对该RAID5阵列中的27块硬盘做了硬件故障检测,发现其中有2块硬盘出现坏道,SMART的错误冗余级别已经超过阈值。将25块正常的硬盘以只读方式进行全盘镜像,将2块发现有坏道的硬盘使用特殊手段进行处理后生成镜像文件。
收集&分析故障存储日志信息,分析判断两块硬盘的掉线时间,用数据较新的硬盘来恢复数据。
存储数据恢复方案:
方案a:把存储的所有硬盘都进行备份,然后通过原厂存储管理软件进行强制上线操作。
方案b:分析底层数据,利用分析获取到的RAID5结构相关信息重组RAID,然后从底层提取数据,重新加载oracle数据库,调试上层应用。
存储数据恢复过程:
1、首先按照方案a在模拟器上进行测试。
2、通过存储设备原厂存储管理软件进行强制上线,强制上线之后raid处于降级状态。设置好热备盘,让热备盘顶上并同步数据。
3、同步完之后,上层的卷可以直接使用了,数据完全可见,上层应用也可以正常使用。北亚企安数据恢复工程师也没想到这么顺利,方案a就直接就搞定了,上层应用可以直接启动,经过用户方多方面测试,确认数据没有问题。
4、将卷里的文件拷贝出来移交给用户方。本次数据恢复工作完成。