• 【服务器数据恢复】infortrend存储RAID6数据恢复案例


    服务器数据恢复环境:
    infortrend某型号存储;
    12块硬盘组成RAID6,一个GPT分区文件系统为NTFS。

     

    服务器故障:
    3块硬盘离线后强制激活并做了REBUILD,数据出错。

    服务器数据恢复过程:
    1、在一台WINDOWS Server服务器上用一张阵列卡接2组磁盘阵列。A组阵列连接12块源盘,B组阵列连接12块目标盘。
    2、保持A组所有磁盘在WINDOWS Server中脱机并激活所有B组硬盘。用工具把A组12块硬盘一对一镜像到B组12块硬盘。
    3、镜像完成后,关机并将A组源盘全部取出,后续的数据恢复操作全部在镜像盘上进行,避免对原始数据造成二次伤害。
    4、分析12块镜像盘结构,发现每块硬盘前部都有明显的RAID信息的痕迹,查找并确定RAID中LUN的起始分配位置。

    5、推断RAID6算法,经过检测分析发现故障RAID6是基于标准P与另一个未知算法法则Q的右异步。基于现有资料分析,基于PQ均等螺旋分布的RAID6只有里德-所罗门(Reed-solomon)算法 ,怀疑本案例中的RAID6为Reed-solomon算法 的变种,但由于在同一条带全0位置发现非全0的情况,故此算法推断不成立。北亚数据恢复工程师结合对控制器的测试,发现故障RAID6的Q校验基于一种随机的xor(如同Park编码),算法完全随机,但校验分布和Park完全不同,所以即使思路相似,但算法不一样。
    6、因为需要找到所有12块盘缺2块盘时的完整算法,共有C(12,2)=66种缺盘情况,每一种至少需要16种运算规则,经程序运行后发现为了得到一个单元大约要运算30-50次xor。用程序生成的运算公式并引入可以简化算法的中间变量层,优化算法模块。
    7、针对一个明显不同步的数据块区,北亚数据恢复工程师专门编写了一段程序。计算所有C(12,2)并比较计算后的结果与预想结果,最后确定掉线盘0号盘与3号盘。
    8、二进制优化算法,所有运算放弃STL,改用数组,并使用bitmap的理念表示表达式中的所有成员,实现算法的最大性能优化。按照算法和分析出来的结构对数据进行初步分析,没有发现明显的数据异常。
    9、生成数据到另一个准备好的目标存储。到此步,数据恢复工作已经完成。

     

    数据恢复总结:
    本案例数据恢复工作断断续续一共耗费了2个月的时间。在整个数据恢复的过程中我们编写了近万行代码进行判断、分析、优化、测试、恢复。
    数据恢复完成后,用户抽查验证的数据全部正常,但不排除有部分数据有少许的损坏。

     

  • 相关阅读:
    设计模式(五)设计原则part2
    在线人才测评,招聘技术研发类岗位的人才测评方案
    iOS 17更新失败或无法更新怎么办?8 个解决方法快速解决!
    运行软件mfc100u.dll缺失是怎么办?mfc100u.dll丢失解决方法分享
    人脸识别技术趋势与发展
    Android 中集成 TensorFlow Lite图片识别
    【CSDN竞赛】第十一期解题报告
    Http域名访问流程
    导数大题练习
    MySQL 的索引和事务
  • 原文地址:https://blog.csdn.net/beiya123/article/details/127844969