Nutanix提供了一个监视和警报实用程序,NCC - Nutanix集群检查,它是预先安装在每个CVM上。
Nutanix Cluster Check是一个强大的框架,包括几个插件来监视和警报不同的硬件和软件组件。它安装在所有节点上的单个集群中的每个CVM上。
它几乎与所有Nutanix产品,如棱镜中心,文件等。NCC将包括这些产品的相关检查,使Nutanix管理员保持对任何软件、配置问题的了解。
下面是一些重要的硬件(物理组件)检查和警报由ncc提供:
a)定期磁盘检查
b)定期检查BIOS / BMC固件(需要版本/升级)
c)启动设备监控(Sata DOM或M.2)
d) SSD和HDD磨损检查
e) BIOS、BMC检查,确保所有硬件组件都是当前稳定的
f)网络接口卡检查
g) IPMI /带外管理接口检查
h)电源检查
i)系统风扇检查
Pro-Tip:始终保持NCC的更新,并且在升级任何软件或硬件组件之前始终运行完整的NCC检查。您可以从Prism元素>运行状况>操作或集群中的任何CVM命令行执行完整的NCC检查:
ncc health_checks run_all
NCC包含一个插件叫做update_hardware_info.
默认情况下,该插件每86400秒自动刷新一次数据。
但是,部件更换后,可以运行update_hardware_info插件刷新缓存的信息。
分享你对NCC的问题/观点