节点重置/重新启动事件

  • 2016年8月17日
  • 2回答
  • 1705的浏览量

徽章 + 10
我们有两个实例,其中一个节点检测到/报告了故障事件,并在每个情况下复位重启虚拟机。似乎没有理由会发生这样的事情。

细节

主机192.168.xx。X4似乎失败了。集群内主机的虚拟机正在重启。08-17-16, 02:01:41am


主机192.168.xx。X4似乎失败了。集群内主机的虚拟机正在重启。08-11-16, 07:19:48am

我们更新了AHV和NCC,从上周的第一次实例到昨晚已经重复了一次

主机是否存在尚未检测或检查的潜在硬件故障?

2回答

Userlevel 6
徽章 + 29
可能是某种硬件NMI或其他问题导致的。支持可以从诊断和日志的角度进行深入研究。

我知道你在另一个帖子里建议你打开一个箱子,你要么跟着那个箱子走,要么打开第二个箱子盖住这个。如果戴尔发现一些硬件问题,他们会采取相应措施,如果没有,他们会把案子交给我们来深入调查。
徽章 +4
如果检查~/data/logs/sysstats/ping_hosts. log。INFO我们记录集群中所有节点之间的ping。

如果节点无法通过网络访问,我们会抛出这个错误,这可能是网络或硬件故障。

如果检查所有节点的正常运行时间,返回的结果是什么?如果它们是一致的,那么很可能是网络中断

回复


Baidu