情况描述:
服务器型号:Dell R720XD
raid: raid1 两块硬盘
硬盘情况:2块,一块failed,一块online
现况:热插拔之后硬盘灯不亮,命令行检测不到新的硬盘,还是老的数据
目标:更换故障硬盘,不丢失数据
RAID 1通过磁盘数据镜像实现数据冗余,在成对的独立磁盘上产生互 为备份的数据。
https://baike.baidu.com/item/RAID%201/10405702
raid1损坏了一块硬盘之后,会自动切换到另一块硬盘上,替换完硬盘后,会自动rebuild新的硬盘,不会对数据和系统有影响。
为了防止失败带来的损失,先对重要和必要的数据进行备份,备份到其他服务器上
备份完了之后,需要关机
以下是一个错误的过程,不要操作!!!!!!
我尝试热插拔,使用了"MegaCli64 -PDOffline -PhysDrv[32:2] -a0“卸载故障盘,没细看返回的信息,直接拔了。
后来发现出问题了,提示的是没有卸载掉故障盘,然后我直接拔了。。。
之后重新插服务器上,出现问题,硬盘指示灯,刚插入的时候,闪烁几秒钟,之后就熄灭了,没反应了,命令行也找不到信息。
后来查看信息,raid和硬盘信息卡在上面了,都是之前的,我换新的硬盘也是第四步的情况, 后来咨询了戴尔的相关人员,反馈的是
“在系统开机之后所有硬盘驱动器都初始化之前,驱动器状态指示灯会一直保持熄灭,此时,驱动器不能进行插入或卸下操作”
也就是说,硬盘已经初始化完成了,不能进行插入和卸下,只能在启动的时候,初始化之前那会,那么服务器就需要重启了。
首先解决灯不亮的问题,开机(因为我刚才在错误的过程中已经插入新的硬盘了)。
提示这个,意思是“以前配置中的所有磁盘都没有了。如果这是意外消息,请关闭系统电源并检查电缆以确保所有磁盘都存在,按任意键继续,或按c加载配置实用程序”,看到这个,先试试恢复坏的硬盘看看能不能开机,然后再决定其他。
替换回原来的硬盘之后,正常开机,查看状态还是failed,然后我尝试卸载它,还是提示失败了,看来是不支持热插拔,很可能是R720xd系统问题,其他的R720系统就可以用命令卸载掉故障盘,也有raid1。
既然硬盘灯熄灭的问题找到了,那么关机,开始更换故障盘。
开机
等到了这个界面之后,按ctrl+r进入到raid管理界面
进入之后是这样的
根据提示,切换到PD Mgmt界面,按ctrl+n是切换下一个
可以看到,新硬盘已经是ready状态了,然后选中该硬盘,按F2(operation操作),进行操作
当时我那边显示的是,只有一个LED blinking和Make Global HS选项,这个选项多是因为已经在rebuild状态,当时忘了拍照了,LED是选择闪烁硬盘灯,让人确认是哪个槽的硬盘,Make Global HS是制作全局热备,因为是两块硬盘做的raid1,所以制作全局热备应该就是当做镜像盘,另一块是主盘了,所以制作热备盘会自动rebuild,变成了raid1的第二块盘,个人推测。移动到Make Global HS选项,回车后,会提示是否,选择是,然后就进入了rebuild状态
因为在这看不到rebuild的进度,也不清楚是否已经开始了,然后我就Esc,保存退出,根据提示进行重启,然后开机正常了,进入系统后可以看到正在rebuild,可以使用命令查看rebuild进度
MegaCli64 -PDRbld -ShowProg -PhysDrv[32:2] -aAll
rebuild完成后,现在两个都是online状态了。
本文链接:https://www.kinber.cn/post/3049.html 转载需授权!
推荐本站淘宝优惠价购买喜欢的宝贝: