NTP对NCC的警告

  • 2020年7月28日
  • 0回答
  • 2456观点

Userlevel 2
徽章 +3
  • Nutanix员工
  • 22日回复

网络时间协议(NTP)是一个在计算机之间进行时钟同步的协议。在Nutanix集群中,主机和cvm需要配置从一系列稳定的NTP服务器同步系统时钟。一般情况下,集群上至少配置1个,最好配置3个或3个以上可靠的集群外NTP服务器。为避免出现脑分裂的情况,建议NTP服务器的个数设置为奇数。

当涉及到NTP配置和故障排除时,可以使用这些快速链接介绍一些主要的内容。请注意,这里的大部分链接都是最新的LTS版本- AOS 5.15(截至2020年7月28日)。

NTP和DNS问题是最常见的NCC故障。在NTP配置问题中,我们通常会看到许多常见的场景。这里是一个快速指南,看看最常见的问题和解决它们的方向。

下面列出了NTP检查警告的最常见原因。

  • 集群中没有配置NTP服务器。
  • 虚拟化环境中没有配置NTP服务器。
  • 虚拟机管理程序上配置的全部或某些NTP服务器与(P)CVM上配置的所有NTP服务器不同。
  • 配置的NTP服务器不可达或对NTP查询无响应。
  • NTP服务器不可靠、不稳定。
  • NTP服务器配置了主机名,但由于DNS/名称解析问题无法解析。
  • NTP端口(UDP / 123)未打开。
  • NTP服务器正在传递(P)CVM NTP客户端认为不适合NTP同步的参数,例如高色散值,偏移,抖动,到达或层。
  • windows操作系统的NTP服务器(AD PDC)使用其本地时钟作为其时间源,默认情况下,AD PDC会将自己通告为一个不太合适的NTP源包括该服务器的NTP参数中的弥散值为10秒。W32time不符合NTP要求的精度,不保证优于±5分钟的误差。
  • 成因服务最近重新启动,NTP同步过程还未完成,或者NTP配置发生变化,可能需要10分钟才能生效。如果有足够的时间使更改生效并同步,那么在10-15分钟后等待并重新运行检查可能会产生不同的结果。
  • 与NTP服务器上的实际时间相比,群集上的时间不同步,并在将来至少5秒钟。

当NTP同步被关闭时,可能会在集群操作中造成一些问题,如日志和日志收集不准确、客户操作系统时间倾斜、用户无法使用LDAP或其他目录集成服务登录到Prism web控制台等。

任何与NTP相关的故障排除的最佳文档是知识库文章# 4519始终要首先参考一般故障排除步骤,然后按照NCC检查所指出的警告消息继续执行特定的故障排除步骤。

在排除任何与NTP相关的问题时,请将此清单放在手边。

  1. 请参阅KB-4519,然后按照常规故障排除步骤操作。
  2. 确保您遵循了NTP配置的最佳实践指导原则。
  3. ping从cvms / hosts配置的NTP服务器。收集NTP服务器IP / hostname的简单方法来自国家结核控制规划服务器选项卡中设置面板的棱镜UI。
  4. 保持“ntpq”命令方便。这个命令的用法在知识库中有更好的解释。这有助于检查NTP参数,如弥散值、偏移量、抖动、到达或层数等,以及为集群寻找NTP领导者。这有助于导航到正确的日志集和有问题的实体。
  5. 另外,在处理配置文件时一定要小心。

而作为一个标准程序,总是运行一个完整的NCC健康报告检查集群上的任何其他关键故障。


0回答

做第一个回复的人!

回复


Baidu