在一个智算项目交付过程中,出现了新建集群中的全部 docker server V19 进程消失、仅剩 docker server 的 unix-socket 存活的现象。
为了验证是否是BD产品研发提供的产品deploy语句缺陷,需要在本地环境上部署一个简单的 docker Deamon 环境。尴尬的是,docker的 official 仓库地址解析不了了。。。
以下是一个借助 中国大陆 repository 安装最新版本 docker Deamon 的 shell 语句块:
基于Ubuntu 24.04 LTS 发行版:
apt update -y
for pkg in docker.io docker-doc docker-compose podman-docker containerd runc; do apt remove -y --purge $pkg; done
apt install -y ca-certificates curl wget gnupg
install -m 0755 -d /etc/apt/keyrings
wget http://mirrors.aliyun.com/docker-ce/linux/ubuntu/gpg -O /etc/apt/keyrings/docker.asc
echo "deb [arch=$(dpkg --print-architecture) signed-by=/etc/apt/keyrings/docker.asc] http://mirrors.aliyun.com/docker-ce/linux/ubuntu $(cat /etc/os-release | awk -F "=" '/VERSION_CODENAME/ {print $2}') stable" | tee /etc/apt/sources.list.d/docker.list
apt update -y
apt install -y docker-ce docker-ce-cli containerd.io docker-buildx-plugin docker-compose-plugin
systemctl is-enabled docker && systemctl is-active docker && docker info && systemctl status docker
【最新的 docker server 默认已经把 Control group 驱动 调整为 systemd 了】
配置 docker-image 的 代理加速 /etc/docker/daemon.json
{
"registry-mirrors": [
"https://9oe2llyt.mirror.aliyuncs.com",
"https://dockerpull.com"
]
}