问题

手动从集群中移除节点

  • 2018年11月20日
  • 6个回答
  • 12的观点

您好,集群中的一个节点发生了硬件故障。我试图通过这个命令删除节点。Ncli host rm-start id=xxxxxxx skip-space-check=true。我可以看到它开始了,但它已经卡住了大约一天左右。我认为问题是CVM没有运行,无法打开,因为节点已经完全失败,甚至无法启动。有没有一种方法,我可以手动强制它通过命令行删除。

本主题已关闭供评论

6个回答

Userlevel 7
徽章 + 25
故障发生前集群中有多少个节点?如果超过3个,集群将反对删除节点,因为它将低于最小值。

失败是什么?你能修理一下吗,还是SSD坏了?
Userlevel 1
徽章 +3
如果您的集群有3个节点,您最好先添加第四个节点(有一个死节点仍然是集群成员),然后再删除第三个节点。如果是4,那么应该是可行的,请检查ncli任务列表中是否有一些卡住的任务,如果它们已经完成,则应该完成节点移除过程。
谢谢你的回复。

我的集群有12个节点。

没有办法,我将能够修复硬件问题,他们是ssd。服务器甚至不会启动。我什么都试过了。我想只是删除他们现在,所以它会给我一些时间修复硬件问题。

唯一正在运行的任务是删除节点的任务。它卡住了好几天了。状态为MARKED_FOR_REMOVAL_BUT_NOT_DETACHABLE。

如果你能告诉我该怎么做,我将不胜感激。

再次感谢. .
Userlevel 7
徽章 + 25
啊,所以这是商业版,不是社区版。;)

假设你对这些节点有支持协议?CE稍有不同,尽管节点驱逐过程类似。不知道我的头顶如何告诉数据复制状态我自己。我会亲自去找他。
我们在节点上没有支持。我们可能会在新年伊始购买新的区块。在购买新节点之前,我们并不认为会出现任何问题,但事实当然并非如此。

谢谢你的回复,我希望论坛上有人遇到过类似的问题。
Userlevel 7
徽章 + 25
所以在这个线程上有一些好的想法来检测移除的状态是什么

https://next.nutanix.com/discussion-forum-14/remove-server-from-cluster-does-not-work-15287

ncli主机get-remove-status

我的直觉告诉我,因为这个节点是不可用的,所以它不能完全清除这个节点。因为节点已经被烤焦了,你不能建立它来把它放回池中。我关心的是影响集群的其他部分。
Baidu