就像许多其他服务一样,NTP是你不考虑直到它休息的东西。然后所有这些奇怪的事情都开始进入你的环境。
症状:
- 用户无法使用LDAP或其他目录集成服务登录到Prism web控制台。
- 群集服务无法启动。由于主要时间偏斜后台内存或维护,群集无法正常运行。
- 日志集合不准确。
- 健康检查依赖于准确的时间框架和事件关联返回不准确的结果。
- 棱镜中不正确和偏斜的图形。
- 用户VMS在带有不准确的RTC(实时时钟)的HyperVisor主机上启动,导致客户操作系统时间偏斜。
- 像veeam或commvault这样的第三方软件产品遇到与群集交互的麻烦。
- 当群集和远程站点之间的时间不同步时,快照将过早到期或太晚过度。
要解决任何疑问,请运行NCC Check_NTP - 除了PASS之外的状态表示需要故障排除。
简而言之,对NTP问题进行故障排除
- NTP服务器是群集实体的外部(是的,可以将NTP配置为群集中的VM,但它不起作用,因此不建议)。
- 使用FQDN配置NTP的位置,验证NTP服务器FQDN名称是由实体解析的。
- 可以访问NTP IP地址(如果ping消息失败,则通过响应于Ping消息目的地Ping另一个响应于另一个响应于Ping流量)。
- 检查NTP服务器返回的响应是否正确、有效。即查询NTP服务器应用层。
- 检查所有CVM和主机上的NTP同步状态。这显示了每个CVM的同步源和时间偏斜值。
- 检查所有主机上的NTP配置-看看是否有任何不一致或任何缺失的配置。
如果CVM时间在未来,不要手动倒拨时钟!联系Nutanix支持有关援助并提供上述产出。
ntp hygiene.
- 将Nutanix AOS/PC集群与基于windows的时间源同步,随着时间的推移会导致问题。Nutanix不建议将集群时间与Windows时间源同步。使用可靠的非windows时间源。
- 使用群集外部的NTP源。
- 对于基于AHV的环境,通过PRISM / NCLI配置NTP服务器更新CVM和AHV主机。
- 在基于ESXi的环境中,在Prism Web控制台或NCLI中配置NTP源不是触发主机上的/etc/ntp.conf文件的自动更新。在棱镜中添加NTP服务器后。您还必须手动在ESXi主机上配置这些NTP服务器。
- 在混合管理程序集群(AHV + ESXi)中,AHV主机将通过棱镜配置,而必须手动更新ESXi主机。
- 在Hyper-V集群中,Check_NTP插件仅验证CVM NTP配置。未选中Windows Hyper-V主机的NTP /时间配置。因此,即使存在NTP错误配置或超出同步状态,也不会通过检查返回故障状态。确认您的Hyper-V主机和域控制器手动具有健康的Windows时间层次结构。AD PDC应该使用可靠的上游NTP时间源,优选地与CVM一起使用的相同(见下文)。
- 理想情况下,为了简化日志的比较,并避免复杂的时间同步问题分类,管理员和控制器VM都应该使用相同的NTP服务器。如果虚拟机管理程序和控制器VMS使用不同的NTP源,则NCC运行状况检查可能会产生信息输出以提高感知并确保配置。
进一步阅读:
KB-4519 NCC健康检查:CHECK_NTP- 详尽的NTP发布故障排除指南。
KB-3851对Windows Time Server进行故障排除NTP同步。
有关在ESXi主机上配置NTP服务器的详细信息,请参阅VMware KB使用vSphere Client在ESX / ESXi主机上配置网络时间协议(NTP)(2012069)。