当主机(SSD或HDD)上的驱动器出现可恢复错误、警告或完全的硬件故障时,星门服务将把该磁盘标记为坏磁盘。
当硬盘出现故障时,可以观察到以下现象:
在棱镜中圆盘为红色或纯灰色
Prism中的一个严重错误,说明磁盘坏了。
故障排除步骤
确定Prism中有问题的磁盘。
请检查Prism web控制台是否有故障磁盘。在Diagram视图中,您可以看到红色或灰色的缺失磁盘。
在Prism web控制台中检查磁盘警报,或在集群中的任何工作cvm中使用以下命令检查已生成故障消息的磁盘。
ncli警报ls
检查磁盘是否被黑色平面识别。在显示磁盘故障的节点的cm上执行以下命令
list_diks
检查磁盘是否挂载在节点上。
df - h
使用NCC检查检查是否有离线磁盘disk_online_check.
NCC health_checks hardware_checks disk_checks disk_online_checks
使用如下命令检查磁盘的健康状态
sudo smartctl -H /dev/sdX(X可以是第3步中该磁盘的字母)
在更换驱动器之前,需要重新启动CVM,以正确显示驱动器失败,或如果它应该回来,可以进一步排除故障,并尝试使其联机
KB文章:
https://portal.nutanix.com/page/documents/kbs/details?targetId=kA0600000008USrCAM