手动从集群中移除节点
您好,集群中的一个节点发生了硬件故障。我试图通过这个命令删除节点。Ncli host rm-start id=xxxxxxx skip-space-check=true。我可以看到它开始了,但它已经卡住了大约一天左右。我认为问题是CVM没有运行,无法打开,因为节点已经完全失败,甚至无法启动。有没有一种方法,我可以手动强制它通过命令行删除。
本主题已关闭供评论
如果您的集群有3个节点,您最好先添加第四个节点(有一个死节点仍然是集群成员),然后再删除第三个节点。如果是4,那么应该是可行的,请检查ncli任务列表中是否有一些卡住的任务,如果它们已经完成,则应该完成节点移除过程。
谢谢你的回复。
我的集群有12个节点。
没有办法,我将能够修复硬件问题,他们是ssd。服务器甚至不会启动。我什么都试过了。我想只是删除他们现在,所以它会给我一些时间修复硬件问题。
唯一正在运行的任务是删除节点的任务。它卡住了好几天了。状态为MARKED_FOR_REMOVAL_BUT_NOT_DETACHABLE。
如果你能告诉我该怎么做,我将不胜感激。
再次感谢. .
我的集群有12个节点。
没有办法,我将能够修复硬件问题,他们是ssd。服务器甚至不会启动。我什么都试过了。我想只是删除他们现在,所以它会给我一些时间修复硬件问题。
唯一正在运行的任务是删除节点的任务。它卡住了好几天了。状态为MARKED_FOR_REMOVAL_BUT_NOT_DETACHABLE。
如果你能告诉我该怎么做,我将不胜感激。
再次感谢. .
所以在这个线程上有一些好的想法来检测移除的状态是什么
https://next.nutanix.com/discussion-forum-14/remove-server-from-cluster-does-not-work-15287
ncli主机get-remove-status
我的直觉告诉我,因为这个节点是不可用的,所以它不能完全清除这个节点。因为节点已经被烤焦了,你不能建立它来把它放回池中。我关心的是影响集群的其他部分。
https://next.nutanix.com/discussion-forum-14/remove-server-from-cluster-does-not-work-15287
ncli主机get-remove-status
我的直觉告诉我,因为这个节点是不可用的,所以它不能完全清除这个节点。因为节点已经被烤焦了,你不能建立它来把它放回池中。我关心的是影响集群的其他部分。