问题

手动从集群中移除节点

  • 2018年11月20日
  • 6个回答
  • 12的观点

您好,集群中的一个节点发生了硬件故障。我试图通过这个命令删除节点。Ncli host rm-start id=xxxxxxx skip-space-check=true。我可以看到它开始了,但它已经卡住了大约一天左右。我认为问题是CVM没有运行,无法打开,因为节点已经完全失败,甚至无法启动。有没有一种方法,我可以手动强制它通过命令行删除。

本主题已关闭供评论

6个回答

Userlevel 7
徽章 + 25
故障发生前集群中有多少个节点?如果超过3个,集群将反对删除节点,因为它将低于最小值。

失败是什么?你能修理一下吗,还是SSD坏了?
Userlevel 1
徽章 +3
如果您的集群有3个节点,您最好先添加第四个节点(有一个死节点仍然是集群成员),然后再删除第三个节点。如果是4,那么应该是可行的,请检查ncli任务列表中是否有一些卡住的任务,如果它们已经完成,则应该完成节点移除过程。
谢谢你的回复。

我的集群有12个节点。

没有办法,我将能够修复硬件问题,他们是ssd。服务器甚至不会启动。我什么都试过了。我想只是删除他们现在,所以它会给我一些时间修复硬件问题。

唯一正在运行的任务是删除节点的任务。它卡住了好几天了。状态为MARKED_FOR_REMOVAL_BUT_NOT_DETACHABLE。

如果你能告诉我该怎么做,我将不胜感激。

再次感谢. .
Userlevel 7
徽章 + 25
啊,所以这是商业版,不是社区版。;)

假设你对这些节点有支持协议?CE稍有不同,尽管节点驱逐过程类似。不知道我的头顶如何告诉数据复制状态我自己。我会亲自去找他。
我们在节点上没有支持。我们可能会在新年伊始购买新的区块。在购买新节点之前,我们并不认为会出现任何问题,但事实当然并非如此。

谢谢你的回复,我希望论坛上有人遇到过类似的问题。
Userlevel 7
徽章 + 25
所以在这个线程上有一些好的想法来检测移除的状态是什么

https://next.nutanix.com/discussion-forum-14/remove-server-from-cluster-does-not-work-15287

ncli主机get-remove-status

我的直觉告诉我,因为这个节点是不可用的,所以它不能完全清除这个节点。因为节点已经被烤焦了,你不能建立它来把它放回池中。我关心的是影响集群的其他部分。
Learn more about our cookies.<\/a>","cookiepolicy.button":"Accept cookies","cookiepolicy.button.deny":"Deny all","cookiepolicy.link":"Cookie settings","cookiepolicy.modal.title":"Cookie settings","cookiepolicy.modal.content":"We use 3 different kinds of cookies. You can choose which cookies you want to accept. We need basic cookies to make this site work, therefore these are the minimum you can select. Learn more about our cookies.<\/a>","cookiepolicy.modal.level1":"Basic
Functional","cookiepolicy.modal.level2":"Normal
Functional + analytics","cookiepolicy.modal.level3":"Complete
Functional + analytics + social media + embedded videos"}}}">
Baidu