最近在做一个开源项目,遇到开发者问各种问题,发现都是系统和软件版本的差异引起的。于是了解了一下docker的使用,发现docker真是个好东东,基本解决了各种版本差异的问题,真正做到了一键部署使用。
先熟悉一下docker里的概念,docker分为镜像和容器,镜像是一个静态的文件,用于分发部署。容器是镜像运行起来后的运行时对象,可以在容器里安装软件、添加文件等,修改后可以用docker commit将容器打成一个新的镜像。 镜像有点类似软件开发中的类,容器类似对象。
整体流程如下图所示
1,最基本的镜像有ubuntu20.04等,但这种只有基础的操作系统。如果用于深度学习,最好已经安装了显卡驱动和cuda等工具,可以上这里CUDA | NVIDIA NGC挑选合适的镜像版本。
用docker pull xxx 拉取镜像到本地,然后可以用docker images查看本地镜像列表。
如果需要删除镜像,用docker rmi <image_id>
2,运行镜像生成一个容器,docker run -it --gpus all <image_id>,其中-it表示启动时进入一个交互命令行,后面可以在这个命令行安装软件等各种操作;--gpus all表示容器需要用到宿主机的显卡,如果不需要用显卡不要加这个。如果中途退出了命令行,可以用docker ps -a 找到这个容器,用docker start <container_id>启动容器,然后用docker exec -it <container_id> /bin/bash 重新进入命令行。 如果需要删除容器,用docker rm <container_id>
正式用docker时用命令docker run --rm --gpus all <image_id>,这时不需要进入交互命令行,--rm表示退出docker时会自动清除容器,这时用docker ps -a也找不到这个容器了。
3,在docker的交互命令行可以进行各种操作,跟在宿主机上操作一样。如果需要从宿主机拷贝文件到容器中,在宿主机上运行命令docker cp <path1> <container_id>:<path2>,其中path1为宿主机上文件路径,path2为容器中文件路径。
可以修改容器里的~/.bashrc,添加自启动命令,这样启动容器后,会自动执行这些命令
4,容器运行环境搭好后,用docker commit <container_id> <image_name>:<tag> 将容器打包成一个新的镜像,打包完成后用docker images可以看到这个新的镜像。
5,发布镜像到阿里云,先上阿里云登录 - 欢迎登录阿里云,安全稳定的云计算服务平台创建一个命名空间,
docker login --username=xxx registry.cn-hangzhou.aliyuncs.com #登录阿里云
docker tag <image_name>:<tag> registry.cn-hangzhou.aliyuncs.com/<命名空间>/<image_name>:<tag>
docker push registry.cn-hangzhou.aliyuncs.com/<命名空间>/<image_name>:<tag>
如果不想发布到网上,只想本地存成一个文件,可以用命令docker export <container_id> > xxx.tar,将容器打包成一个文件,然后将这个文件拷到其他电脑上,用docker import xxx.tar <image_name>:<tag> 来导入成镜像
docker运行中缓存清除,可以用命令docker builder prune,docker system prune
题外话
其实我们在阿里云上的云服务器就是阿里基于物理主机给我们开了一个容器而已,我们又在这个容器里用docker新开了更多容器,有点像俄罗斯套娃。我们的现实世界又何尝不是套娃呢。