解决了

Karbon 2.3和Calico CNI的部署问题

  • 2021年10月17日
  • 5个答复
  • 160次观看

徽章

你好呀,

看来我在部署的尽头接近失败。这是来自karbon_core.out的输出

2021-10-17T11:57:31.052Z kube_prometheus.go:1016:[debug] [k8s_cluster = rgs-pa-k8-cluster阶段]期望5个节点在kube-system namespace中运行Calico-node daemon daemon pod。当前正在运行:4
2021-10-17T11:57:33.093Z kube_prometheus.go:1016:[debug] [k8s_cluster = rgs-pa-k8-cluster阶段]期望5个节点在kube-system namesspace中运行Calico-node daemon Pod。当前正在运行:4
2021-10-17T11:57:35.135Z kube_prometheus.go:1016:[debug] [k8s_cluster = rgs-pa-k8-cluster阶段]期望5个节点在kube-system namesspace中运行Calico-node daemon Pod。当前正在运行:4
2021-10-17T11:57:36.806Z CALICO.GO:552:[错误] [k8s_cluster = rgs-pa-k8 cluster阶段]无法验证Calico addon
2021-10-17T11:57:36.806Z k8s_deploy.go:1478:[错误] [k8s_cluster = rgs-pa-k8-cluster阶段阶段]未能部署卡利科/绒布/绒布:无法部署calico:失败的calico:Operative calico:Operative califify califify califify califify califify califify:时机:期望5个节点将在Kube-System名称空间中运行Calico节点守护程序POD。当前正在运行:4
2021-10-17T11:57:36.806Z k8s_deploy.go:155:[错误] [k8s_cluster = rgs-pa-k8-cluster阶段]无法部署群集插件:失败无法部署K8S群集Addon:无法部署Calico Calico:无法验证Calico:Operation Outed Out:期望在Kube-System名称空间中运行5个节点。当前正在运行:4
2021-10-17T11:57:36.832Z k8s_lib_deploy_task.go:112: [ERROR] [k8s_cluster=RGS-PA-K8-CLUSTER-STAGING] failed to deploy K8s cluster: failed to deploy cluster addons: failed to deploy K8s cluster addon:无法部署印花布:无法验证卡利科:操作定时:期望在Kube-System名称空间中运行5个节点。当前正在运行:4
2021-10-17T11:57:36.832Z k8s_lib_deploy_task.go:78:[info] [info] [k8s_cluster = rgs-pa-k8-cluster阶段] token refresher refersher收到了pocrefresh
2021-10-17T11:57:36.844Z deploy_k8s_task.go:364:[错误] [k8s_cluster = rgs-pa-k8-cluster staging]群集RGS-pa-k8-cluster staging staging:失败K8S cluster:失败:失败部署群集插件:无法部署K8S群集插件:无法部署卡利科:无法验证卡利科:操作时机计时:期望5个节点在Kube-System名称空间中运行Calico-Node Daemon Pod。当前正在运行:4
2021-10-17T11:57:36.844Z deploy_k8s_task.go:370:[info] [k8s_cluster = rgs-pa-k8-cluster阶段]

如果有人有任何洞察力如何解决这个问题,请非常感谢!

图标

最好的答案乔森纳克斯2021年10月18日,10:28

Hi Igor,<\/p>

I suggest you open a ticket with support, so they can investigate why this pod is crashing (saw calico-node-bvct7 crashing once too). Two of three containers in this pod are alive, with calico-node crashing not finding \/var\/lib\/calico\/nodename. Usually this is sort of issues are related to network\/performance issues.\u00a0<\/p>","className":"post__content__best_answer"}">

查看原件

该主题已关闭以供评论

5个答复

徽章

忘了发布,豆荚状态:

名称空间名称准备状态重新启动年龄
Kube-System Calico-kube-controllers-7F667666F7F-ND8SX 1/1运行1 74m
Kube-System Calico-Node-2ctb4 1/1运行0 74m
Kube-System Calico-Node-7FX7N 1/1运行0 74m
Kube-System Calico-node-bvct7 1/1运行1 74m
Kube-System Calico-node-fjwjp 0/1 crashloopbackoff 23 74m
Kube-System Calico-node-XTH2K 1/1运行0 74m
Kube-System Calico-Typha-6bfd555555df7-ptc7d 1/1运行0 74m
Kube-System Kube-apiserver-karbon-rgs-pa-k8-cluster strusting-e77682-k8s-master-0 3/3运行0 77m
Kube-System Kube-apiserver-karbon-rgs-pa-k8-cluster Stiging-e77682-k8s-Master-1 3/3运行0 77m
Kube-System Kube-Proxy-DS-DSD5V 1/1运行0 74m
Kube-System Kube-Proxy-ds-gnng4 1/1运行0 74m
Kube-System Kube-Proxy-DS-PH68Q 1/1运行0 74m
Kube-System Kube-Proxy-DS-TF4ML 1/1运行0 74m
Kube-System Kube-Proxy-DS-WHBPL

UserLevel 4
徽章 +5

嗨,伊戈尔,

操作正时。您必须检查站点之间是否有足够的带宽来拉图像。

另外,您可以检查吊舱的日志Calico-node-fjwjp看看它是否下载了图像,如果确实如此,那么卡利科为什么要崩溃。

徽章

你好,

是的,带宽很好……进行了一些基本的测试,所有基于K8的VM都很好。很奇怪的是,他的特殊豆荚无法初始化印花布网络,因此karbon部署失败了。不过(自动)并未删除Karvon群集,因此有机会环顾四周。

对于豆荚Calico-node-fjwjp

Kube-System Calico-node-fjwjp 0/1 crashloopbackoff 327 19h

它一直在重新启动,因为人们期望的是未达到准备状态。

事件:
从消息输入原因年龄
---------------------------------------------------------------------------------------------
警告不健康的12m(X2224超过19H)kubelet准备就绪探针失败:Calico/Node还没有准备好:bird尚未准备就绪:未准备好:失败stat()nodeName文件:stat/var/var/lib/lib/calico/nodeName:没有这样的文件或目录
警告向后2M46S(X3945超过19H)库贝特退出重新启动失败容器

POD的全部输出描述:

名称:Calico-node-fjwjp
名称空间:Kube-System
优先级:2000001000
优先类名称:系统节点至关重要
节点:karbon-rgs-pa-k8群集阶段-E77682-k8s-worker-0/10.20.25.73
开始时间:2021年10月17日太阳11:47:36 +0000
标签:Controller-Revision-Hash = 547955649b
k8s-app =卡利科节点
POD-Template生成= 1
注释:scheduler.alpha.kubernetes.io/critical-pod:
状态:运行
IP:10.20.25.73
IPS:
IP:10.20.25.73
控制者:Daemonset/Calico节点
初始容器:
升级 - ipam:
容器ID:Docker:// 025878DE4F3AB420BDC8D572C1037FF591C892F32B1607C1F60F60F60F523C398DB8DE
图片:quay.io/karbon/cni:v3.14.0
图片ID:docker-pullable://quay.io/karbon/cni@sha256:CC951CCD15AA8C94B1B3EEC673E434853BF3BF3BF8C2DEB8C2DEB83B83BDB4A3B4A3F934C68E0E8EAEAE
端口:
主机端口:
命令:
/opt/cni/bin/calico-ipam
-升级
状态:终止
原因:完成
退出代码:0
开始:2021年10月17日太阳11:47:45 +0000
完成:2021年10月17日太阳11:47:45 +0000
准备好:是的
重新启动计数:0
环境:
kubernetes_node_name :( v1:spec.nodeName)
calico_networking_backend:<设置为键'calico_backend'配置映射'calico-config'>可选:false
坐骑:
/host/opt/opt/cni/bin,来自CNI-BIN-DIR(RW)
/var/lib/cni/网络来自主机 - 本地网络dir(RW)
/var/run/secrets/kubernetes.io/serviceaccount来自Calico-node-token-x5lvc(ro)
install-cni:
容器ID:Docker:// 455ED002C1D8450E362FCA773854F54000022229A11401C3943D00D691060827
图片:quay.io/karbon/cni:v3.14.0
图片ID:docker-pullable://quay.io/karbon/cni@sha256:CC951CCD15AA8C94B1B3EEC673E434853BF3BF3BF8C2DEB8C2DEB83B83BDB4A3B4A3F934C68E0E8EAEAE
端口:
主机端口:
命令:
/innstall-cni.sh
状态:终止
原因:完成
退出代码:0
开始:2021年10月17日太阳11:47:47 +0000
完成:2021年10月17日太阳11:47:47 +0000
准备好:是的
重新启动计数:0
环境:
cni_conf_name:10-calico.conflist
cni_network_config:<设置为键'cni_network_config'config map'calico-config'>可选:false
kubernetes_node_name :( v1:spec.nodeName)
cni_mtu:<设置为“配置映射”键'veth_mtu'calico-config'>可选:false
睡眠:错误
坐骑:
来自cni-net-dir(RW)的/host/etc/cni/net.d
/host/opt/opt/cni/bin,来自CNI-BIN-DIR(RW)
/var/run/secrets/kubernetes.io/serviceaccount来自Calico-node-token-x5lvc(ro)
Flexvol-Driver:
容器ID:Docker:// 68F392F6D3BDE62F14185FB50C6B41099982BD63AC060CCBADC18522E84FDC60B
图片:quay.io/karbon/pod2daemon-flexvol:v3.14.0
图片ID:docker-pullable://quay.io/karbon/pod2daemon-flexvol@sha256:e5f2c2b9e67ec463ef5b538bf538bf10453cc6a6538f72888a4760ee9255149251498E798E7DD
端口:
主机端口:
状态:终止
原因:完成
退出代码:0
开始:2021年10月17日太阳11:47:51 +0000
完成:2021年10月17日太阳11:47:51 +0000
准备好:是的
重新启动计数:0
环境:<无>
坐骑:
/flexvol-driver-host(RW)的主机/驱动程序
/var/run/secrets/kubernetes.io/serviceaccount来自Calico-node-token-x5lvc(ro)
容器:
Calico节点:
容器ID:docker:// 96FA1881578BD5BAE774A6F25FFC108888888888888888888888888882413EF4ACB6C8E450CF6B38345A8D
图像:quay.io/karbon/node:v3.14.0
图片ID:docker-pullable://quay.io/karbon/node@sha256:1a643541c41c46ea412de19454bfada5a7e03e7e03e7cbbbbbbbbbbbb51dddf76def9baf9baf9baf84baf84baf84bdad7c
端口:
主机端口:
状态:等待
原因:crashloopbackoff
最后状态:终止
原因:错误
退出代码:137
开始:2021年10月18日星期一07:41:15 +0000
完成:2021年10月18日星期一07:42:24 +0000
准备就绪:false
重新启动计数:327
要求:
CPU:250m
livices:exec [/bin/calico节点-felix-live] delay = 10s timeout = 1s oferout = 1s perique = 10s#成功= 1##失败= 6
准备时间:exec [/bin/calico节点-felix -ready-bird-Ready] delay = 0s timeout = 1S oferout = 1S oferet = 10s#成功= 1###fafer = 3
环境:
datastore_type:kubernetes
felix_typhak8sserviceName:<设置为“ typha_service_name”配置映射'calico-config'>可选:false
WAIT_FOR_DATASTORE:正确
nodename :( v1:spec.nodeName)
calico_networking_backend:<设置为键'calico_backend'配置映射'calico-config'>可选:false
cluster_type:k8s,bgp
IP:自动检索
Calico_ipv4pool_ipip:从不
ip_autodetection_method:接口= eth。*
felix_ipinipmtu:<设置为“配置映射”键'veth_mtu'calico-config'>可选:false
Calico_ipv4pool_cidr:172.20.0.0/16
Calico_Advertise_cluster_ips:172.19.0.0/16
Calico_disable_file_logging:true
felix_defaultendpointTohostaction:接受
felix_ipv6support:false
felix_logseverityscreen:info
Felix_HealthEnabled:true
felix_prometheusgometricsenabled:false
felix_prometheusmetricsEnabled:true
坐骑:
/lib/lib-modules(RO)的LIB/模块
/run/xtables.lock from xtables-lock(rw)
/var/lib/calico来自var-lib-calico(RW)
/var/run/calico来自var-run-calico(RW)
/var/run/nodeagent来自policySync(RW)
/var/run/secrets/kubernetes.io/serviceaccount来自Calico-node-token-x5lvc(ro)
条件:
类型状态
初始化的true
准备好了
容器准备的false
podscheduled true
卷:
lib模型:
类型:主机(裸机目录卷)
路径: /lib /模块
HOSTPATHTYPE:
var-run-calico:
类型:主机(裸机目录卷)
路径:/var/run/calico
HOSTPATHTYPE:
var-lib-calico:
类型:主机(裸机目录卷)
路径:/var/lib/calico
HOSTPATHTYPE:
Xtables-Lock:
类型:主机(裸机目录卷)
路径:/run/xtables.lock
主机路径:FileOrcreate
CNI-BIN-DIR:
类型:主机(裸机目录卷)
路径:/var/lib/hyperkube/opt/cni/bin
HOSTPATHTYPE:
CNI-NET-DIR:
类型:主机(裸机目录卷)
路径:/etc/cni/net.d
HOSTPATHTYPE:
主机 - 本地网络dir:
类型:主机(裸机目录卷)
路径:/var/lib/cni/网络
HOSTPATHTYPE:
policySync:
类型:主机(裸机目录卷)
路径:/var/run/nodeagent
主机路径:目录
Flexvol-Driver-Host:
类型:主机(裸机目录卷)
路径:/usr/libexec/kubernetes/kubelet-plugins/卷/exec/nodeagent〜uds
主机路径:目录
Calico-node-token-X5LVC:
类型:秘密(由秘密填充的卷)
SecretName:Calico-node-token-X5LVC
可选:错误
QoS类:可爆裂
节点选择器:kubernetes.io/os=linux
公差:: noschedule op =存在
:noexecute op =存在
Criticaladdonsonly op =存在
node.kubernetes.io/disk-pressure:noschedule op =存在
node.kubernetes.io/memory-pressure:noschedule op =存在
node.kubernetes.io/network-unavailable:noschedule op =存在
node.kubernetes.io/not-ready:noexecute op =存在
node.kubernetes.io/pid-pressure:noschedule op =存在
node.kubernetes.io/unreachable:noexecute op =存在
node.kubernetes.io/unschedulable:noschedule op =存在
事件:
从消息输入原因年龄
---------------------------------------------------------------------------------------------
警告不健康的14m(X2224超过19H)kubelet准备就绪探针失败:卡利科/节点还没有准备就绪:伯德还没有准备好:无法使用stat()nodeName file:stat/var/var/lib/calico/node
名称:没有这样的文件或目录
警告向后4M24S(19H上方x3945)库贝特退出重新启动失败容器

UserLevel 4
徽章 +5

嗨,伊戈尔,

我建议您打开一张支持票,以便他们可以调查为什么这个吊舱崩溃了(看到Calico-node-bvct7也一次崩溃了)。该吊舱中的三个容器中有两个还活着,Calico节点崩溃没有找到/var/lib/calico/nodename。通常,这是与网络/性能问题有关的问题。

徽章

嗨,何塞,

是的,这很好 - 只是想弄清楚如何提高支持票,因为我从来没有很高兴使用它:脸红:

是的,似乎有些特定的工人节点(10.20.25.73)和属于那里的豆荚并通过kubelet进行通信,而不是严格来自卡利科节点:

igor.stankovic@rgs-pa-bastion-1:〜$ kubectl -n kube-system logs -f kube-proxy-ds-whbpl
服务器中的错误:获取“ https://10.25.73:10250/containerlogs/kube-system/kube-proxy-ds-whbpl/kube-proxy?follow=true”:dial TCP 10.20.25.73:10250:I/O超时
igor.stankovic@rgs-pa-bastion-1:〜$

我们试图重新启动Kubelet,Docker然后完全回收VM节点,但仍然相同。

从支持中听到会很有趣。

Learn more about our cookies.<\/a>","cookiepolicy.button":"Accept cookies","cookiepolicy.button.deny":"Deny all","cookiepolicy.link":"Cookie settings","cookiepolicy.modal.title":"Cookie settings","cookiepolicy.modal.content":"We use 3 different kinds of cookies. You can choose which cookies you want to accept. We need basic cookies to make this site work, therefore these are the minimum you can select. Learn more about our cookies.<\/a>","cookiepolicy.modal.level1":"Basic
Functional","cookiepolicy.modal.level2":"Normal
Functional + analytics","cookiepolicy.modal.level3":"Complete
Functional + analytics + social media + embedded videos"}}}">
Baidu