dive是一个用于研究 Docker 镜像、层内容以及发现缩小 Docker/OCI 镜像大小方法的开源工具.
开源地址: dive github
为了有个直观的印象, 可以先看一下repo文档中的gif图:
安装
在Ubuntu/Debian系统下,可以使用deb包安装:
DIVE_VERSION=$(curl -sL "https://api.github.com/repos/wagoodman/dive/releases/latest" | grep '"tag_name":' | sed -E 's/.*"v([^"]+)".*/\1/')
curl -OL https://github.com/wagoodman/dive/releases/download/v${DIVE_VERSION}/dive_${DIVE_VERSION}_linux_amd64.deb
sudo apt install ./dive_${DIVE_VERSION}_linux_amd64.deb
可能会遇到下载的问题,可以在repo的release中,找到适合当前os及arch的安装包,然后执行 sudo apt install
.
其他系统的安装请参照仓库文档.
docker image方式
dive提供了docker镜像, 如果不想安装在本地,可以用docker的方式运行.
首先下载镜像:
docker pull wagoodman/dive
或者自行build,从官方repo clone代码到本地后,执行build命令:
docker build -t "your-image-tag" .
然后执行:
docker run -it --rm -v /var/run/docker.sock:/var/run/docker.sock wagoodman/dive <your-docker-image-tag>
注意这里的-v /var/run/docker.sock:/var/run/docker.sock
是必须的.
或者为了方便,也可以创建一个alias:
alias dive="docker run -ti --rm -v /var/run/docker.sock:/var/run/docker.sock wagoodman/dive"
运行镜像分析
我们用如下命令来分析一个镜像:
dive nginx:latest
可以得到如上图所示的输出.通过上下健移动,可以看到不同layer的信息,包括执行的command, 当前layer的文件系统信息, 文件的变化等…
官方文档中给出的功能列表包括:
显示 Docker 镜像分层内容
当您在左侧选择一个层时,您将在右侧看到该层及其之前所有层的内容。您还可以使用箭头键完全浏览文件树。
指示每个层中的变更
文件树中会标出哪些文件发生了变更、修改、添加或删除。这可以调整为显示特定层的变更,或累积到该层的变更。
估算"镜像效率"
左下窗格显示基本层信息和一个实验性指标,用于猜测您的镜像中包含多少浪费的空间。这可能是由于在层之间重复文件、移动文件或未完全删除文件造成的。它提供了百分比"得分"和总的浪费文件空间。
小结
dive是一个非常有用的小工具,可以帮助我们很直观的分析镜像,尤其是可以看到镜像中文件系统的变化; 另外镜像效率这个功能也很有用, 可以用于image的大小优化. 在打包一些LLM模型镜像时,由于大量的python三方包和推理加速中间件的安装,很容易造成镜像变得巨大无比,对镜像尺寸压缩优化就变得重要起来. 后续会继续分享如何优化docker image的大小,欢迎交流.