问题

您可以承受多少个节点失败?(4node cluster -rf2)

  • 2020年10月28日
  • 4个答复
  • 641视图

徽章

你好。我对RF2功能有疑问。

目前,它由4个节点和RF2作为群集组成。

据我所知,RF2有1个节点失败。

如果是这样,数据弹性状态不应该失败吗?

但是,尽管一个节点失败了,但数据弹性状态仍然可以。

实际上,当前群集中的CPU,内存和存储使用率很低。

目前,只有3个节点为Active CPU为20%的存储器为40%存储为18.5%。

为什么数据弹性状态可以?

即使目前关闭了一个节点,该服务也有任何问题吗?

还是群集会死亡,如果有1个节点死亡?

如果您不死,我想知道为什么。


4个答复

UserLevel 2
徽章 +4

你好 @cubensys

解释非常简单。
Nutanix不仅基于最小节点数量(群集为3),而且基于资源的可用性。

这对您而言是什么意思?

您有4个带有RF2的节点,当一个节点失败时,AOS立即开始复制数据以返回稳定的RF2状态。由于您有4个节点,并且可能有足够的资源可以使工作负载保持活跃,因此系统仅用3个节点返回稳定状态。

如果您的群集处于3个节点或3个活跃节点上的资源不足以使工作负载完全运行,那么这显然不会发生。

现在,将数据弹性处于确定状态,您可以失去另一个节点,然后您将面临关键状态。

希望这可以帮助

徽章
谢谢您的回答。资源可用性?
UserLevel 2
徽章 +4
谢谢您的回答。资源可用性?

不确定我是否理解您的问题,但是通常,如果您对N+1的3个节点群集大小,当一个节点失败时,临界状态仅意味着您无法放松其他组件,但所有工作负载都启动并运行。否则,系统仅维护运行的工作负载,而其他资源则停止。

您可以确定您的群集将用于3种不同的设置的HA类型

最好的努力(系统将根据资源消耗自动决定)

HA(系统将保留每个节点的专用内存,以实现HA的目的)

专用节点(系统将整个节点荣誉用作备用)此设置已弃用

您会在此处找到有关HA如何工作的更多有用信息

https://portal.nutanix.com/page/documents/kbs/details?targetId=ka00e0000000000liquca4

UserLevel 6
徽章 +5

嗨,Cubensys,

与其从节点角度观察任务,而要从数据观点的副本数量查看。

您有4个节点。在RF-2群集中,您有2个数据副本。您会失去一个节点,这意味着您将丢失数据的第二副本的一部分。预期的初始数据弹性状态失败了,因为如果您丢失了另一个节点,则有可能在该节点中丢失相同数据的另一个副本。

但是,数据的第二副本仍然可以通过复制现有数据来恢复。复制过程完成后,群集数据弹性状态返回到确定。

回复


Baidu