docker存储卷

docker存储卷

COW机制

Docker镜像由多个只读层叠加而成,启动容器时,Docker会加载只读镜像层并在镜像栈顶部添加一个读写层。

如果运行中的容器修改了现有的一个已经存在的 文件,那么该文件将会从读写层下面的只读层复制到读写层,该文件的只读版本依然存在,只是已经被读写层中该文件的副本所隐藏,这就是“写时复制(COW)”机制。

在这里插入图片描述

对于这种方式来说,我们去访问一个文件,修改和删除等一类的操作,其效率会非常的低,因为隔着很多层镜像。

而要想绕过这种限制,我们可以通过使用存储卷的机制来实现。

什么是存储卷

存储卷就是将宿主机的本地文件系统中存在的某个目录直接与容器内部的文件系统上的某一目录建立绑定关系。这就意味着,当我们在容器中的这个目录下写入数据时,容器会将其内容直接写入到宿主机上与此容器建立了绑定关系的目录。

在这里插入图片描述

在宿主机上的这个与容器形成绑定关系的目录被称作存储卷。

使用存储卷的好处

如果容器中跑的进程的所有有效数据都保存在存储卷中,从而脱离容器自身文件系统之后,带来的好处是当容器关闭甚至被删除时,只要不删除与此容器绑定的在宿主机上的这个存储目录,我们就不用担心数据丢失了。因此就可以实现数据持久,脱离容器的生命周期而持久。

我们通过这种方式管理容器,容器就可以脱离主机的限制,可以在任意一台部署了docker的主机上跑容器,而其数据则可以置于一个共享存储文件系统上,比如nfs。

Docker的存储卷默认情况下是使用其所在的宿主机上的本地文件系统目录的,也就是说宿主机上有一块属于自己的硬盘,这个硬盘并没有共享给其他的Docker主机,而在这台主机上启动的容器所使用的存储卷是关联到此宿主机硬盘上的某个目录之上。

这就意味着容器在这台主机上停止运行或者被删除了再重建,只要关联到硬盘上的这个目录下,那么其数据还存在。但如果在另一台主机上启动一个新容器,那么数据就没了。而如果在创建容器的时候我们手动的将容器的数据挂载到一台nfs服务器上,那么这个问题就不再是问题了。

为什么要用存储卷

关闭并重启容器,其数据不受影响,但删除Docker容器,则其更改将会全部丢失。

因此Docker存在的问题有:

  • 存储于联合挂载文件系统中,不易于宿主机访问
  • 容器间数据共享不便
  • 删除容器其数据会丢失

而要解决这些问题,解决方案就是使用存储卷。

存储卷管理方式

存储卷(Data Volume)于容器初始化时被自动创建,由base image提供的卷中的数据会于此期间完成复制。

Volume的初衷是独立于容器的生命周期实现数据持久化,因此删除容器之时既不会删除卷,也不会对未被引用的卷做垃圾回收操作。

存储卷为Docker提供了独立于容器的数据管理机制,我们可以把镜像想象成静态文件,例如“程序”,把卷类比为动态内容,例如“数据”。所以镜像可以重用,而卷则可以共享。

卷实现了“程序(镜像)”和“数据(卷)”的分离,以及“程序(镜像)”和“制作镜像的主机”的分离,用户制作镜像时无须再考虑镜像运行的容器所在的主机的环境。

在这里插入图片描述

存储卷的分类

Docker有两种类型的卷,每种类型都在容器中存在一个挂载点,但其在宿主机上的位置有所不同:

  • Bind mount volume(不是手动的删除,即使删除容器,也存在)
    • a volume that points to a user-specified location on the host file system
  • Docker-managed volume (删除容器,不存在)
    • the Docker daemon creates managed volumes in a portion of the host’s file system that’s owned bye Docker

在这里插入图片描述

示例: 删除容器数据还在

# 在容器中
[root@localhost ~]# docker run -it --rm httpd /bin/bash
root@3279d1258e83:/usr/local/apache2# ls
bin  build  cgi-bin  conf  error  htdocs  icons  include  logs	modules
root@3279d1258e83:/usr/local/apache2# exit
exit# 在真机中
[root@localhost ~]# mkdir /webroot
[root@localhost ~]# [root@localhost ~]# docker ps -a
CONTAINER ID   IMAGE     COMMAND   CREATED   STATUS    PORTS     NAMES
[root@localhost ~]# docker run -d --rm -v /webroot:/usr/local/apache2/htdocs httpd 
f76e2c2e9c91319beb0c085198287955e3ae932c2b0a4c239acafcbd84e126d6
[root@localhost ~]# docker ps
CONTAINER ID   IMAGE     COMMAND              CREATED         STATUS         PORTS     NAMES
f76e2c2e9c91   httpd     "httpd-foreground"   8 seconds ago   Up 6 seconds   80/tcp    youthful_visvesvaraya
[root@localhost ~]# # 进入容器
[root@localhost ~]# docker exec -it f76e2c2e9c91 /bin/bash
root@f76e2c2e9c91:/usr/local/apache2# cd htdocs/
root@f76e2c2e9c91:/usr/local/apache2/htdocs# ls //什么都没有
root@f76e2c2e9c91:/usr/local/apache2/htdocs# # 在真机创建一个网站页面
[root@localhost ~]# cd /webroot/
[root@localhost webroot]# echo "hello world" > index.html
[root@localhost webroot]# ls
index.html
[root@localhost webroot]# # 再次查看容器中
root@f76e2c2e9c91:/usr/local/apache2/htdocs# ls
index.html //有了在真机中创建的网站网页# 停止容器,测试是否数据还在
[root@localhost ~]# docker ps
CONTAINER ID   IMAGE     COMMAND              CREATED         STATUS         PORTS     NAMES
f76e2c2e9c91   httpd     "httpd-foreground"   6 minutes ago   Up 6 minutes   80/tcp    youthful_visvesvaraya
[root@localhost ~]# docker stop f76e2c2e9c91 
f76e2c2e9c91
[root@localhost ~]# docker ps -a
CONTAINER ID   IMAGE     COMMAND   CREATED   STATUS    PORTS     NAMES
[root@localhost ~]# 查看
[root@localhost webroot]# ls
index.html //数据依然还在
[root@localhost webroot]# # 访问一下
[root@localhost ~]# docker run -d --rm -v /webroot:/usr/local/apache2/htdocs httpd 
fa0eeebc1c586be93eaa0fd47825c7eb7111bed3eb5b6760716b3d8485a0506b
[root@localhost ~]# 
[root@localhost ~]# docker ps
CONTAINER ID   IMAGE     COMMAND              CREATED         STATUS         PORTS     NAMES
fa0eeebc1c58   httpd     "httpd-foreground"   6 seconds ago   Up 4 seconds   80/tcp    charming_heisenberg
[root@localhost ~]# curl 172.17.0.2
hello world //依然可以访问
[root@localhost ~]# # 进入容器查看是否数据还在[root@localhost ~]# docker exec -it fa0eeebc1c58 /bin/bash
root@fa0eeebc1c58:/usr/local/apache2# ls htdocs/
index.html
root@fa0eeebc1c58:/usr/local/apache2#

容器数据管理

用户在使用Docker的过程中,往往需要能查看容器内应用产生的数据,或者需要把容器内的数据进行备份,甚至多个容器之间进行数据的共享,这必然涉及容器的数据管理操作。

容器中管理数据主要有两种方式:

  • 数据卷(Data Volumes)
  • 数据卷容器(Data Volumes Containers)

容器Volume使用语法:
Docker-managed volume

语法格式:docker run -it --name CONTAINER_NAME -v VOLUMEDIR IMAGE_NAME

[root@localhost ~]# docker run -it --rm -v /data busybox //data与真机的某个目录绑定,没有指定,没有固定的位置
/ # ls
bin   data  dev   etc   home  proc  root  sys   tmp   usr   var
/ # cd data/
/data # ls
/data # touch abc
/data # # 查看
[root@localhost ~]# docker ps
CONTAINER ID   IMAGE     COMMAND   CREATED         STATUS         PORTS     NAMES
28ef103fb798   busybox   "sh"      5 minutes ago   Up 5 minutes             amazing_beaver
[root@localhost ~]# [root@localhost ~]# docker inspect 28ef103fb798"Mounts": [{"Type": "volume","Name": "63e268c29a5ffe57d1c2cee5f47d9ef956fdeb3e408039754caa953f94bc462f","Source": "/var/lib/docker/volumes/63e268c29a5ffe57d1c2cee5f47d9ef956fdeb3e408039754caa953f94bc462f/_data","Destination": "/data","Driver": "local","Mode": "","RW": true,"Propagation": ""
[root@localhost ~]# cd /var/lib/docker/volumes/63e268c29a5ffe57d1c2cee5f47d9ef956fdeb3e408039754caa953f94bc462f/_data //这个位置时随机的
[root@localhost _data]# ls
[root@localhost _data]# ls
abc  //因为做了映射
[root@localhost _data]# 

Bind mount volume

语法格式:docker run -it --name CONTAINER_NAME -v HOSTDIR:VOLUMEDIR IMAGE_NAME

[root@localhost ~]# docker run -it --rm -v /host/data:/data busybox 
/ # 
# 开另外一个终端查看
[root@localhost ~]# ls /
........
boot  etc  host (host被创建) .....
[root@localhost /]# ls host/
data
[root@localhost /]# 在容器中data目录中也是空的并创建一个文件
/ # ls
bin   data  dev   etc   home  proc  root  sys   tmp   usr   var
/ # cd data/
/data # ls
/data # touch abc
/data # # 在真机中查看
[root@localhost /]# ls host/data/
abc
[root@localhost /]# # 退出容器并查看数据是否还在
[root@localhost /]# ls host/data/
abc

在容器中使用数据卷

在容器内创建一个数据卷

下面使用nginx镜像创建一个web容器,并创建一个数据卷挂载到容器的/webapp目录下:

[root@localhost ~]# docker run -d -P --name web -v /webapp nginx

这里的-P是允许外部访问容器需要暴露的端口

挂载一个主机目录作为数据卷

[root@localhost ~]# docker run -d -P --name web1 -v /var/www/html:/webapp nginx

上面的命令加载主机的/var/www/html目录到容器的/webapp目录:
这个功能在进行测试的时候非常方便,比如用户可以放置一些程序或数据到本地目录中,然后在容器内运行和使用。另外,本地目录的路径必须是绝对路径,如果目录不存在,Docker会自动创建。

Docker挂载数据卷的默认权限是读写(rw),用户也可以通过(ro)指定为只读:

[root@localhost ~]# docker run -d -P --name web2 -v /var/www/html:/webapp:ro nginx
[root@localhost ~]# docker run -it --rm -v /host/data:/data:ro busybox 
/ # cd /data/
/data # ls 
abc
/data # echo "hello world" >> abc
sh: can't create abc: Read-only file system //会报错不可以创建,因为只读模式
/data # # 但是可以在真机中写,然后容器中也会一样
[root@localhost data]# echo "hello world" >> abc
[root@localhost data]## 在容器中查看
/data # cat abc 
hello world
/data # 

加了:ro以后,容器内挂载的数据卷的数据就无法修改了。

挂载一个本地主机文件作为数据卷
-v选项也可以从主机挂载单个文件到容器中作为数据卷:

[root@localhost ~]# docker run -it --rm -v ~/.bash_history:/.bash_history centos /bin/bash

如果直接挂载一个文件到容器,使用文件编辑工具,包括vi或者sed去修改文件内容的时候,可能会造成inode的改变,这样将会导致错误。所以推荐的方式是直接挂载文件所在的目录。

数据卷容器

如果用户需要在容器之间共享一些持续更新的数据,最简单的方式是使用数据卷容器。数据卷容器其实就是一个普通的容器,专门用它提供数据卷供其他容器挂载使用,方法如下:

首先,创建一个数据卷容器dbdata,并在其中创建一个数据卷挂载到/dbdata:

[root@localhost ~]# docker run -it -d --name dbdata -v /dbdata centos

示例:

[root@localhost ~]# docker run -it --rm --name dbdata -v /dbdata busybox
/ # ls
bin     dev     home    root    tmp     var
dbdata  etc     proc    sys     usr
/ # cd dbdata/
/dbdata # ls
/dbdata # 

然后可以在其他容器中使用–volumes-from来挂载dbdata容器中的数据卷,例如创建db1和db2两个容器,并从dbdata容器挂载数据卷:

[root@localhost ~]# docker run -d --name db1 --volumes-from dbdata centos
[root@localhost ~]# docker run -d --name db2 --volumes-from dbdata centos
示例:# 第一个容器
[root@localhost data]#  docker run -it --rm --volumes-from dbdata busybox
/ # ls 
bin     dev     home    root    tmp     var
dbdata  etc     proc    sys     usr
/ # cd dbdata/
/dbdata # 
# 第二个容器
root@localhost ~]# docker run -it --rm --volumes-from dbdata busybox
/ # ls 
bin     dev     home    root    tmp     var
dbdata  etc     proc    sys     usr
/ # cd dbdata/  这是两个dbdata 里面都是空的# 在第一台容器中添加内容/dbdata # echo 'hello world' > abc
/dbdata # ls
abc
/dbdata # cat abc 
hello world
/dbdata # # 查看第二台容器
/ # cd dbdata/
/dbdata # ls
abc
/dbdata # cat abc 
hello world
/dbdata # 
即使删除dbdata容器,数据依然存在

此时,容器db1和db2都挂载同一个数据卷到相同的/dbdata目录。三个容器任何一方在该目录下的写入,其他容器都可以看到。
例如,在db1容器中创建一个test文件:

[root@localhost ~]# docker exec -it db1 /bin/bash
[root@75b50c43ce20 /]# ls
bin  dbdata  dev  etc  home  lib  lib64  lost+found  media  mnt  opt  proc  root  run  sbin  srv  sys  tmp  usr  var
[root@75b50c43ce20 /]# cd dbdata/
[root@75b50c43ce20 dbdata]# touch test
[root@75b50c43ce20 dbdata]# ls

在db2容器中查看:

[root@localhost ~]# docker exec -it db2 /bin/bash
[root@c0b4bb5ff5b9 /]# ls dbdata/
test

可以多次使用–volumes-from参数来从多个容器挂载多个数据卷。还可以从其他已挂载了容器卷的容器来挂载数据卷:

[root@localhost ~]# docker run -d --name db3 --volumes-from db1 centos

使用–volumes-from参数所挂载数据卷的容器自身并不需要保持在运行状态。

如果删除了挂载的容器(包括dbdata、db1和db2),数据卷并不会被自动删除。如果要删除一个数据卷,必须在删除最后一个还挂载着它的容器时显式使用docker rm -v命令来指定同时删除关联的容器。

利用数据卷容器迁移数据

可以利用数据卷容器对其中的数据卷进行备份、恢复,以实现数据的迁移。

备份
使用下面的命令来备份dbdata数据卷容器内的数据卷:

[root@localhost ~]# docker run --name worker --volumes-from dbdata -v $(pwd):/backup centos tar cvf /backup/backup.tar /dbdata

这个命令稍微有点复杂,具体分析下。
首先利用centos镜像创建了一个容器worker。使用–volumes-from dbdata参数来让worker容器挂载dbdata容器的数据卷(即dbdata数据卷);使用-v $(pwd):/backup参数来挂载本地的当前目录到worker容器的/backup目录。
worker容器启动后,使用了tar cvf /backup/backup.tar /dbdata命令来将/dbdata下内容备份为容器内的/backup/backup.tar,即宿主主机当前目录下的backup.tar。

恢复
如果要恢复数据到一个容器,可以按照下面的操作。首先创建一个带有数据卷的容器dbdata2:

[root@localhost ~]# docker run -it --name dbdata2 -v /dbdata centos /bin/bash

然后创建另一个新的容器,挂载dbdata2容器,并使用untar解压备份文件到所挂载的容器卷中即可:

[root@localhost ~]# docker run --volumes-from dbdata2 -v $(pwd):/backup busybox tar xvf /backup/bac

批量删除容器

[root@localhost ~]# docker ps -a[root@localhost ~]# docker rm -f $(docker ps -aq)

批量删除镜像

[root@localhost ~]# docker ps -aq
[root@localhost ~]# docker images -q
beae173ccac6
605c77e624dd
dabbfbe0c57b
dabbfbe0c57b
[root@localhost ~]# docker rmi -f $(docker images -q)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/133687.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

AI人工智能大模型业务到底有多烧钱?

AI大模型业务确实是一个非常烧钱的行业。首先,大模型的训练需要大量的计算资源。 这些模型通常由数百万个参数组成,训练它们需要大量的计算能力和存储空间。这意味着公司需要购买大量的高性能服务器、图形处理单元和存储设备,这些都是非常昂…

QT学习之QT概述

1.1 什么是QT? Qt是一个跨平台的C图形用户界面应用程序框架。 QT特点: 跨平台,几乎支持所有的平台接口简单,容易上手,学习QT框架对学习其他框架有参考意义。一定程度上简化了内存回收机制开发效率高,能够…

使用lua-resty-request库编写爬虫IP实现数据抓取

目录 一、lua-resty-request库介绍 二、使用lua-resty-request库进行IP数据抓取 1、获取IP地址 2、设置请求 3、处理数据 三、代码实现 四、注意事项 五、总结 本文将深入探讨如何使用lua-resty-request库在爬虫程序中实现IP数据抓取。我们将首先介绍lua-resty-request…

【算法|二分查找No.2】leetcode 69. x 的平方根

个人主页:兜里有颗棉花糖 欢迎 点赞👍 收藏✨ 留言✉ 加关注💓本文由 兜里有颗棉花糖 原创 收录于专栏【手撕算法系列专栏】【LeetCode】 🍔本专栏旨在提高自己算法能力的同时,记录一下自己的学习过程,希望…

【Docker】Docker中 的AUFS、BTRFS、ZFS、存储池概念的详细讲解

前言 作者简介: 辭七七,目前大二,正在学习C/C,Java,Python等 作者主页: 七七的个人主页 文章收录专栏: 七七的闲谈 欢迎大家点赞 👍 收藏 ⭐ 加关注哦!💖&…

Apache Doris (五十二): Doris Join类型 - Broadcast Join

🏡 个人主页:IT贫道_大数据OLAP体系技术栈,Apache Doris,Clickhouse 技术-CSDN博客 🚩 私聊博主:加入大数据技术讨论群聊,获取更多大数据资料。 🔔 博主个人B栈地址:豹哥教你大数据的个人空间-豹哥教你大数据个人主页-哔哩哔哩视频 目录 1. Broadcast Join原理

接口测试及接口测试工具

首先,什么是接口呢? 接口一般来说有两种,一种是程序内部的接口,一种是系统对外的接口。 系统对外的接口:比如你要从别的网站或服务器上获取资源或信息,别人肯定不会把数据库共享给你,他只能给你…

DocTemplateTool - 可根据模板生成word或pdf文件的工具

你是否经常遇到这样的场景:产品运营有着大量的报告需求,或者给客户领导展现每周的运营报告?这些文档类的任务可以交给运营同事,他们负责文档排版和样式,你作为开发人员你只需要提供数据源,和一个映射表&…

Elasticsearch:在 ES|QL 中使用 DISSECT 和 GROK 进行数据处理

目录 DISSECT 还是 GROK? 或者两者兼而有之? 使用 DISSECT 处理数据 Dissect pattern 术语 例子 DISSECT 关键修饰符 右填充修饰符 (->) 附加修饰符 () 添加顺序修饰符( 和 /n) 命名的跳过键(&#xff1f…

MinIO 分布式文件(对象)存储

简介 MinIO是高性能、可扩展、云原生支持、操作简单、开源的分布式对象存储产品。 在中国:阿里巴巴、腾讯、百度、中国联通、华为、中国移动等等9000多家企业也都在使用MinIO产品 官网地址:http://www.minio.org.cn/ 下载 官网下载(8.4.3版本)&#x…

WSGI与ASGI:两种Python Web服务器网关接口的比较

在当今的Web开发领域,选择合适的服务器网关接口(Server Gateway Interface,简称SGI)对于提高Web应用程序的性能和并发性至关重要。在Python中,有两种常见的SGI:WSGI和ASGI。本文将深入探讨这两种SGI的异同点…

通过51单片机控制SG90舵机按角度正反转转动

一、前言 本文介绍如何通过51单片机控制SG90舵机实现角度的正反转转动。SG90舵机是一种常用的微型舵机,具有体积小、重量轻、结构简单等特点,被广泛应用于机器人、遥控模型和各种自动控制系统中。 使用51单片机(STC89C52)作为控…

变压器试验VR虚拟仿真操作培训提升受训者技能水平

VR电气设备安装模拟仿真实训系统是一种利用虚拟现实技术来模拟电气设备安装过程的培训系统。它能够为学员提供一个真实、安全、高效的学习环境,帮助他们更好地掌握电气设备的安装技能。 华锐视点采用VR虚拟现实技术、MR混合现实技术、虚拟仿真技术、三维建模技术、人…

ubuntu22.04桌面版系统无法识别USB摄像头

虚拟机连接电脑摄像头连接失败(驱动程序错误) 本文为转载:版权归远作者所有,之所以转载是为了避免被原作者删除 巴黎铁塔下的女孩 你尽管努力,剩下的交给时间 虚拟机调用电脑的摄像头,正常情况下只需点击…

3.5、Linux:命令行git的使用

个人主页:Lei宝啊 愿所有美好如期而遇 在Linux Centos7.6下安装git yum -y install git 注册一个gitee账号 进去注册就好,记住自己的用户名和密码。 创建一个仓库 点击复制,接着就可以在Linux上使用了 git clone git clone 刚才复制的地…

el-select多选以tag展示时,超过显示长度以...省略号显示,且在一行展示

效果&#xff1a; 代码&#xff1a; <span>系统词典维度&#xff1a;</span><el-selectv-model"dNum"placeholder"请选择"multiplecollapse-tags //设置collapse-tags属性将它们合并为一段文字size"small"style"width:160p…

Python模块导入出现ModuleNotFoundError: No module named ‘***’解决方法

概述 几年没弄python了&#xff0c;全部还会给老师&#xff0c;今天弄了个demo&#xff0c;老是报错&#xff0c;在此记录下&#xff0c;方便后续查阅。 环境&#xff1a;Windows10 开发IDEA&#xff1a;PyCharm 2023.1.3 1、报错如下所示 2、解决方法&#xff1a;安装execjs…

第十一章《搞懂算法:聚类是怎么回事》笔记

聚类是机器学习中一种重要的无监督算法&#xff0c;可以将数据点归结为一系列的特定组合。归为一类的数据点具有相同的特性&#xff0c;而不同类别的数据点则具有各不相同的属性。 11.1 聚类算法介绍 人们将物理或抽象对象的集合分成由类似 的对象组成的多个类的过程被称为聚…

技术干货 | GreatDB新一代读写分离架构,如何炼就近乎0损耗的性能?

优化数据库性能并降低成本是每位架构师和DBA都必须面对的挑战。其中&#xff0c;读写分离是一种常见方法&#xff1a;即通过将读操作和写操作分发到不同的数据库实例&#xff0c;实现多副本负载和性能提升。 传统的中间件方案&#xff0c;例如基于Proxysql、HAProxy、MySQL Ro…

学习笔记:CANOE模拟LIN主节点和实际从节点进行通信测试

先写点感想&#xff0c;在LIN开发阶段&#xff0c;我一般用图莫斯USB工具来进行模拟主机节点发送数据。后来公司买了CANOE工具就边学习边搭建了LIN的测试工程&#xff0c;网上的资料真的很少&#xff0c;主要是靠自己一点点摸索前进&#xff0c;总算入门。几个月后的今天&#…