网络时间协议(NTP)是一个在计算机之间进行时钟同步的协议。在Nutanix集群中,主机和cvm需要配置从一系列稳定的NTP服务器同步系统时钟。一般情况下,集群上至少配置1个,最好配置3个或3个以上可靠的集群外NTP服务器。为避免出现脑分裂的情况,建议NTP服务器的个数设置为奇数。
当涉及到NTP配置和故障排除时,可以使用这些快速链接介绍一些主要的内容。请注意,这里的大部分链接都是最新的LTS版本- AOS 5.15(截至2020年7月28日)。
- 在cvm和AHV上配置NTP服务器,请参见国家结核控制规划服务器配置在里面Prism Web控制台指南.(通过Prism配置NTP服务器将同时更新cvm和AHV主机)。
- 在ESXi主机上配置NTP服务器,请参见使用vSphere Client在ESX/ESXi主机上配置NTP (2012069).
- 要在Hyper-V主机上配置NTP服务器,请向下滚动到在Hyper-V上配置NTP部分的KB-4519..
- 有关使用NTP服务器的建议,请参见时间同步建议.
- 可以使用此操作对Windows Time Server进行故障排除KB篇文章。
NTP和DNS问题是最常见的NCC故障。在NTP配置问题中,我们通常会看到许多常见的场景。这里是一个快速指南,看看最常见的问题和解决它们的方向。
下面列出了NTP检查警告的最常见原因。
- 集群中没有配置NTP服务器。
- 虚拟化环境中没有配置NTP服务器。
- 虚拟机管理程序上配置的全部或某些NTP服务器与(P)CVM上配置的所有NTP服务器不同。
- 配置的NTP服务器不可达或对NTP查询无响应。
- NTP服务器不可靠、不稳定。
- NTP服务器配置了主机名,但由于DNS/名称解析问题无法解析。
- NTP端口(UDP / 123)未打开。
- NTP服务器正在传递(P)CVM NTP客户端认为不适合NTP同步的参数,例如高色散值,偏移,抖动,到达或层。
- windows操作系统的NTP服务器(AD PDC)使用其本地时钟作为其时间源,默认情况下,AD PDC会将自己通告为一个不太合适的NTP源包括该服务器的NTP参数中的弥散值为10秒。W32time不符合NTP要求的精度,不保证优于±5分钟的误差。
- 成因服务最近重新启动,NTP同步过程还未完成,或者NTP配置发生变化,可能需要10分钟才能生效。如果有足够的时间使更改生效并同步,那么在10-15分钟后等待并重新运行检查可能会产生不同的结果。
- 与NTP服务器上的实际时间相比,群集上的时间不同步,并在将来至少5秒钟。
当NTP同步被关闭时,可能会在集群操作中造成一些问题,如日志和日志收集不准确、客户操作系统时间倾斜、用户无法使用LDAP或其他目录集成服务登录到Prism web控制台等。
任何与NTP相关的故障排除的最佳文档是知识库文章# 4519.始终要首先参考一般故障排除步骤,然后按照NCC检查所指出的警告消息继续执行特定的故障排除步骤。
在排除任何与NTP相关的问题时,请将此清单放在手边。
- 请参阅KB-4519,然后按照常规故障排除步骤操作。
- 确保您遵循了NTP配置的最佳实践指导原则。
- ping从cvms / hosts配置的NTP服务器。收集NTP服务器IP / hostname的简单方法来自国家结核控制规划服务器选项卡中设置面板的棱镜UI。
- 保持“ntpq”命令方便。这个命令的用法在知识库中有更好的解释。这有助于检查NTP参数,如弥散值、偏移量、抖动、到达或层数等,以及为集群寻找NTP领导者。这有助于导航到正确的日志集和有问题的实体。
- 另外,在处理配置文件时一定要小心。
而作为一个标准程序,总是运行一个完整的NCC健康报告检查集群上的任何其他关键故障。