Dell服务器RAID5磁盘阵列故障处理:热备盘制作与坏盘替换全过程
Dell服务器RAID5磁盘阵列故障处理:热备盘制作与坏盘替换全过程
本文详细描述了Dell服务器RAID5磁盘阵列出现故障时的解决过程,包括热备盘的制作和坏盘替换。文章内容专业且具体,包含了背景介绍、方案选择、概念解释、操作步骤以及注意事项。对于IT运维人员和服务器管理员来说,具有很高的实用价值。
背景
在上次数据恢复之后,还有两块盘的问题没有解决,就是2号和8号盘。今天要更换这两块盘,同时制作热备。
方案
- 先换8做成热备,拆2,然后8顶上,再把2做成热备;
- 先插2,然后8做成热备。
如果方案1先把8盘做成热备之后,它会检测到2盘有错误,直接让8替换2吗?带着这个疑问,选择了方案1。
概念
RAID制作热备时,除了全局热备(Global Hot Spare)外,还有独立热备(Dedicated Hot Spare)的配置方式。这两种方式的主要区别和特点如下:
全局热备(Global Hot Spare)
定义:全局热备指热备硬盘可以作为整个通道上所有阵列的热备。
特点:
- 灵活性高:可以在多个RAID阵列之间共享热备硬盘。
- 适用范围广:适用于多个RAID阵列同时运行,且可能出现多个磁盘故障的场景。
- 配置简单:在RAID管理界面中进行全局配置即可。
独立热备(Dedicated Hot Spare)
定义:为每个特定的RAID阵列或磁盘配置一个或多个专用的Hot Spare磁盘。
特点:
- 针对性强:每个RAID阵列或磁盘都有专用的热备硬盘,确保故障发生时能迅速替换。
- 安全性高:由于热备硬盘是专用的,因此可以确保在特定RAID阵列或磁盘故障时始终有可用的替换硬盘。
- 配置相对复杂:需要针对每个RAID阵列或磁盘单独配置热备硬盘。
总结:
在选择全局热备还是独立热备时,需要根据具体的RAID配置、业务需求以及预算等因素进行综合考虑。全局热备适用于需要跨多个RAID阵列提供热备支持的场景,而独立热备则更适用于对特定RAID阵列或磁盘提供独立热备支持的场景。在配置热备硬盘时,还需要注意热备硬盘的容量必须至少与RAID阵列中最大的活动磁盘容量相同或更大,以确保在替换故障磁盘后能够存储从其他磁盘上重建的数据。
过程
制作8号盘为热备
清除配置
当在现有的RAID配置中添加热备盘时,如果系统中存在旧的、不兼容的或已损坏的配置信息,可能会导致配置冲突。清除配置可以确保RAID系统从干净的状态开始,避免潜在的配置问题。
在Foreign View中,选择PERC H700 Integrated,按F2,选择Foreign Confg,再选择Clear
系统通常会提示确认是否要清除Foreign Configuration,选择OK
此时8号状态已经变成了ready
制作独立热备
在Disk Group上按F2(也就是在raid5阵列上制作独立热备),选择Manage Ded.HS((管理独立热备))
在弹出的选项中,使用空格键选择想要设置为独立热备的硬盘。确保选择的硬盘容量至少与RAID 5阵列中最大的活动磁盘容量相同或更大。此时选择8号盘(前面的X就代表选中了),使用TAB键或方向键选择“OK”,然后按回车键确认配置。
开始制作热备
热备顶替坏盘直接rebuild
神奇的一幕出现了,8号直接替换了2号,进入了rebuild 过程
果然和猜想的一样,8号热备制作好之后,检测到2号有问题,直接替换了2号。
raid5阵列中的所有盘的活动灯(下面的灯)都亮了,一起工作,重建阵列
在PD Mgmt中可以看到8号和2号的状态,2号还是显示Failed,一会儿就来更换它,再看下它的状态的改变
更换2号盘
此时8号还在rebuiild,2号更换之后的状态
制作2号盘为热备
2号热备制作完成
最后,8号加入raid5阵列,正在rebuild,2号做成了raid5阵列的独立热备
最后的最后,阵列rebuild成功,热备时刻准备着
在PD Mgmt页面
活动灯也都不亮了,工作完了,休息了
注意事项
在进行任何RAID配置更改之前,请务必备份重要数据,以防数据丢失。
配置RAID和热备时,请确保按照服务器的硬件规格和RAID控制器的要求进行操作。
不同的服务器和RAID控制器可能有不同的配置步骤和选项
foreign状态要先清除配置
如果使用的盘里带有原有的raid配置,必须要先清除,否则会提示下面的内容
或者,如果直接import