kubectl describe pod coredns-545d6fc579-s9g5s -n kube-system
找到原因1:CoreDNS Pod 处于 Pending 状态的原因是集群中的节点都带有 node.kubernetes.io/not-ready 污点
journalctl -u kubelet -f
14:57:59.178592 3553 remote_image.go:114] "PullImage from image service failed" err="rpc error: code = Unknown desc = error pulling image configuration: download failed after attempts=6: dial tcp 4.78.139.50:443: connect: connection refused" image="docker.io/calico/cni:v3.25.0"
找到原因2:Kubelet 在尝试从 docker.io 拉取 Calico 的 CNI 镜像时失败,连接被拒绝
查看calico.yaml中所需要的镜像,发现都是从docker hub中拉取的,目前由于政策原因,只能更换加速器
[root@k8s-master ~]# grep image calico.yaml | sort | uniq image: docker.io/calico/cni:v3.25.0image: docker.io/calico/kube-controllers:v3.25.0image: docker.io/calico/node:v3.25.0imagePullPolicy: IfNotPresent
解决操作1:添加加速器
cat /etc/docker/daemon.json
{
"registry-mirrors": ["https://b9pmyelo.mirror.aliyuncs.com","https://dockerpull.com","https://docker.aityp.com/"],
"exec-opts": ["native.cgroupdriver=systemd"]
}
之后重新拉取calico镜像
kubectl delete -f calico.yaml
kubectl apply -f calico.yaml
kubectl get pods -n kube-system
calico-node-dzq28 0/1 Init:0/3 0 5m40s
calico-node-vsnwj 0/1 Init:0/3 0 5m40s
找到原因3:可以看出有两个clico节点pod尚未初始化成功
kubectl describe pod calico-node-dzq28 -n kube-system
找到原因4: 根据 kubectl describe
的输出,显示 kubelet
一直在尝试拉取 docker.io/calico/cni:v3.25.0
镜像,但没有成功完成拉取。这通常意味着节点无法从 Docker 仓库拉取镜像。
解决操作2:前面只更换了master节点中docker的操作,故节点还是无法拉取镜像,只需给节点添加相应镜像
添加后,重启docker,在重新执行操作1,所有pod都是runnning