您是否经常混淆生成的警报和Nutanix群集检查(NCC)失败?
这里有一些要点可以让你更好地理解它们:
警告:报告系统中潜在问题的机制。
NCC:用于检查群集运行状况并在必要时报告警报的工具。(如果出现NCC故障,它并不总是生成警报。)
上图的三个重要部分:
- 收到的通知-群集运行状况服务。
- 配置存储- IDF数据库。
- 警报报告-警报管理器。
配置和告警报告:
警报报告基于上述配置。
我们也可以通过“ncli alerts get-alert-config”获取上述信息,并使用“ncli alerts update-alert-config”进行更新。
工具:
检查接收到nos-alert的警报:Zygrade
检查警报:的见解
日志/命令:
Alert Manager leader: alert_tool
检查警报通知是否发送到电子邮件收件人:alert_manager。信息"日志文件在警报管理器领导。
检查警报生成通知/插件:"health_server.log请登录产生告警的节点。
KB:
KB1959哪些警报自动生成支持案例与Nutanix支持?
KB2595Nutanix支持服务:脉冲和警报