NTP问题:症状,诊断,治疗和预防

  • 2019年12月17日
  • 0回复
  • 4400意见

UserLevel 6.
徽章 +5
  • Nutanix员工
  • 433回复

就像许多其他服务一样,NTP是你不考虑直到它休息的东西。然后所有这些奇怪的事情都开始进入你的环境。

症状:

  • 用户无法使用LDAP或其他目录集成服务登录到Prism web控制台。
  • 群集服务无法启动。由于主要时间偏斜后台内存或维护,群集无法正常运行。
  • 日志集合不准确。
  • 健康检查依赖于准确的时间框架和事件关联返回不准确的结果。
  • 棱镜中不正确和偏斜的图形。
  • 用户VMS在带有不准确的RTC(实时时钟)的HyperVisor主机上启动,导致客户操作系统时间偏斜。
  • 像veeam或commvault这样的第三方软件产品遇到与群集交互的麻烦。
  • 当群集和远程站点之间的时间不同步时,快照将过早到期或太晚过度。

要解决任何疑问,请运行NCC Check_NTP - 除了PASS之外的状态表示需要故障排除。

简而言之,对NTP问题进行故障排除

  • NTP服务器是群集实体的外部(是的,可以将NTP配置为群集中的VM,但它不起作用,因此不建议)。
  • 使用FQDN配置NTP的位置,验证NTP服务器FQDN名称是由实体解析的。
  • 可以访问NTP IP地址(如果ping消息失败,则通过响应于Ping消息目的地Ping另一个响应于另一个响应于Ping流量)。
  • 检查NTP服务器返回的响应是否正确、有效。即查询NTP服务器应用层。
  • 检查所有CVM和主机上的NTP同步状态。这显示了每个CVM的同步源和时间偏斜值。
  • 检查所有主机上的NTP配置-看看是否有任何不一致或任何缺失的配置。

:嘭嘭:如果CVM时间在未来,不要手动倒拨时钟联系Nutanix支持有关援助并提供上述产出。

ntp hygiene.

  • 将Nutanix AOS/PC集群与基于windows的时间源同步,随着时间的推移会导致问题。Nutanix不建议将集群时间与Windows时间源同步。使用可靠的非windows时间源。
  • 使用群集外部的NTP源。
  • 对于基于AHV的环境,通过PRISM / NCLI配置NTP服务器更新CVM和AHV主机。
  • 在基于ESXi的环境中,在Prism Web控制台或NCLI中配置NTP源不是触发主机上的/etc/ntp.conf文件的自动更新。在棱镜中添加NTP服务器后。您还必须手动在ESXi主机上配置这些NTP服务器。
  • 在混合管理程序集群(AHV + ESXi)中,AHV主机将通过棱镜配置,而必须手动更新ESXi主机。
  • 在Hyper-V集群中,Check_NTP插件仅验证CVM NTP配置。未选中Windows Hyper-V主机的NTP /时间配置。因此,即使存在NTP错误配置或超出同步状态,也不会通过检查返回故障状态。确认您的Hyper-V主机和域控制器手动具有健康的Windows时间层次结构。AD PDC应该使用可靠的上游NTP时间源,优选地与CVM一起使用的相同(见下文)。
  • 理想情况下,为了简化日志的比较,并避免复杂的时间同步问题分类,管理员和控制器VM都应该使用相同的NTP服务器。如果虚拟机管理程序和控制器VMS使用不同的NTP源,则NCC运行状况检查可能会产生信息输出以提高感知并确保配置。

进一步阅读:

KB-4519 NCC健康检查:CHECK_NTP- 详尽的NTP发布故障排除指南。

KB-3851对Windows Time Server进行故障排除NTP同步

时间同步的建议在里面棱镜Web控制台指南

有关在ESXi主机上配置NTP服务器的详细信息,请参阅VMware KB使用vSphere Client在ESX / ESXi主机上配置网络时间协议(NTP)(2012069)


0回复

做第一个回复的人!

回复


Baidu