我有一个Dev Nutanix群集,我用来托管Kubernetes簇。今天,我在其中添加了一个大的kuberentes群集(我打算将其添加到我的prod nutanix群集中,但意外地添加到了Dev Nutanix群集中)。
我开始从Dev Nutanix集群上托管的3个Kubernetes群集中的2个中获得很多警报。安装完成后,我从Dev Nutanix群集中删除了大型Kubernetes群集。
我认为,由于资源都已释放,因此集群会很好。但是我在使用`kubectl'时仍会遇到错误。
最常见的两个是:
服务器中的错误:ETCDSERVER:请求超时
和
无法连接到服务器:拨号TCP 10.62.12.91:443:Connectex:由于目标机积极拒绝,因此无法建立连接。
10.62.12.91是我的控制平面主机。
我试图重新启动ETCD服务器和控制平面主机。这没有解决这个问题。
我将Dev Nutanix群集加载到PRIM元素中,并且没有给出任何错误(只有几个警告是无支撑的快照功能等)。
它表明有很多内存,CPU和磁盘空间可用。
Karbon显示了几个错误警报,但现在只有一个头说:警报:普罗米修斯未能获取警报
我该如何修复我的kubernetescluster?
最好的答案乔森纳克斯
I see you have restarted your instances with no luck. Not sure if you followed the following order:<\/p>
- Shutdown the VMs<\/li>\t
- Start etcd first (wait at least 2 minutes)<\/li>\t
- Start control plane (wait at least 1 minute)<\/li>\t
- Start the workers<\/li><\/ul>
If this doesn\u2019t solve the problem, I suggest you open a support case.<\/p>","className":"post__content__best_answer"}">