我想完全责怪人们认为自我康复能够解决Nutanix Cloud簇(NC2)的所有问题。对于坏nics,硬盘驱动器和节点来说,自我修复非常棒,但是在某些情况下,门户网站无法采取行动。
每分钟每分钟执行AWS的状态检查,返回云门户中的通行证或失败状态。如果所有检查通过,则实例的总体状态还可以。如果一项或多项检查失败,则整体状态会受到损害。
状态检查,系统状态检查和实例状态检查有两种类型。系统状态检查监视实例运行的AWS系统。实例状态检查监视单个实例的软件和网络配置。
集群门户的通知中心
群集门户网站有一项通知服务,可以跟踪所有信息,警告和关键警报。像大多数基于云的服务一样,门户网站上没有SNMP的支持,但确实可以发送电子邮件地址。我们的建议是利用Pagerduty之类的服务,该服务可以启动可能需要的其他工作流程。
在部署NC2之前,请确保配置此选项。在Nutanix门户上的KB9704中的更多信息,
快乐的乌云。