故障处理节点硬盘故障

  • 2020年10月2
  • 1回复
  • 1270的浏览量

Userlevel 2
徽章 +4
  • Nutanix员工
  • 70回复

当主机(SSD或HDD)上的驱动器出现可恢复错误、警告或完全的硬件故障时,星门服务将把该磁盘标记为坏磁盘。

当硬盘出现故障时,可以观察到以下现象:

  1. 在棱镜中圆盘为红色或纯灰色

  2. Prism中的一个严重错误,说明磁盘坏了。

故障排除步骤

  1. 确定Prism中有问题的磁盘。

    1. 请检查Prism web控制台是否有故障磁盘。在Diagram视图中,您可以看到红色或灰色的缺失磁盘。

    2. 在Prism web控制台中检查磁盘警报,或在集群中的任何工作cvm中使用以下命令检查已生成故障消息的磁盘。

ncli警报ls

  1. 检查磁盘是否被黑色平面识别。在显示磁盘故障的节点的cm上执行以下命令

list_diks

  1. 检查磁盘是否挂载在节点上。

df - h

  1. 使用NCC检查检查是否有离线磁盘disk_online_check

NCC health_checks hardware_checks disk_checks disk_online_checks

  1. 使用如下命令检查磁盘的健康状态

sudo smartctl -H /dev/sdX(X可以是第3步中该磁盘的字母)

在更换驱动器之前,需要重新启动CVM,以正确显示驱动器失败,或如果它应该回来,可以进一步排除故障,并尝试使其联机

KB文章:

https://portal.nutanix.com/page/documents/kbs/details?targetId=kA0600000008USrCAM


1回复

Userlevel 2
徽章 +4

如果磁盘被列为“tombstone”,是否仍然需要CVM重启(或任何这些命令/测试)或磁盘重置?

ncli磁盘ls-tombstone-entries

回复


Baidu