有时,NCC (Nutanix Cluster Check)会为PSU down发出警报,当检测到PSU down时,会自动创建一个case。这可能是一个假阳性的警告或短暂的错误(当重新定位一个节点或一些维护,需要电源关闭)。
然而,电力供应警报绝不能掉以轻心。人们总是可以通过检查电源单元本身的LED指示灯来验证电源的物理状态,但在某些情况下,这可能不可能马上-由于设备位置等。
通过登录物理主机或CVM虚拟机执行命令,可以查看Block或Node的电源状态。
从AHV主机:[root@AHV-HOST~]# ipmitool sdr | grep -i ps
PS1状态| 0x01 | ok
PS2状态| 0x01 | ok
从AHV上的CVM(这将查询集群中的所有主机):
nutanix@cvm$ hostssh "ipmitool SDR | grep -i ps"
在ESXi主机的CVM中:
查询所有主机的电源状态。
nutanix@cvm$ hostssh "/ipmitool sensor | grep -i ps"
那么上面的输出是什么意思呢:
它们的输出应该显示PS1和PS2的值为0x1或01。
表示电源模块读状态良好。如果一个PSU显示的值不是上面的良好读数,请在同一块的其他主机上运行相同的命令。
请注意:值为'nr’表示不可恢复,需要更换电源模块。