生产环境中使用 Docker 的过程中, 往往需要对数据进行持久化, 或者需要在多个容器之间进行数据共享, 这必然涉及容器的数据管理操作.
容器中管理数据主要有两种方式:
- 数据卷: 容器内数据直接映射到本地主机环境.
- 数据卷器: 使用特定容器维护数据卷.
数据卷
数据卷是一个可供容器使用的特殊目录, 它将主机操作系统目录直接映射进容器, 类似于 Linux 中的 mount 操作.
数据卷可以提供很多有用的特性, 如下所示:
1.数据卷可以在容器之间共享和重用, 容器间传递数据将变得高效而方便.
2.对数据卷内数据的修改会立马生效, 无论是容器内操作还是本地操作.
3.对数据卷的更新不会影响镜像, 解耦了应用和数据.
4.卷会一直存在, 直到没有容器使用, 可以安全的卸载它.
1.在容器内创建一个数据卷
在用 docker run
命令的时候, 使用 -v
标记可以在容器内创建一个数据卷. 多次使用 -v
标记可以创建多个数据卷.
下面使用 centos 镜像创建一个 web 容器, 并创建一个数据卷挂载到容器的 /webapp 目录:
docker run -it -v /webapp centos
2.挂载一个主机目录作为数据卷
使用 -v
标记也可以指定挂载一个本地已有目录到容器中去作为数据卷(推荐方式).
docker run -v /src/webapp:/opt/webapp centos
上面的命令加载主机的 /src/webapp 目录到容器的 /opt/webapp 目录.
这个功能在进行测试的时候十分方便, 比如用户可以将一些程序或数据放到本地目录中, 然后在容器内运行和使用. 另外, 本地目录的路径必须是绝对路径, 如果目录不存在 Docker, 会自动创建.
Docker 挂载数据卷的默认权限是读写(rw), 用户可以通过 ro 指定为只读:
docker run -v /src/webapp:/opt/webapp:ro centos
加了 :ro
之后, 容器内所挂载数据卷内的数据就无法修改了.
3.挂载一个本地主机文件作为数据卷
-v
标记也可以从主机挂载单个文件到容器中作为数据卷(不推荐).
docker run --rm -it -v ~/.bash_history:/.bash_history centos /bin/bash
这样就可以记录在容器输入过的命令历史了.
如果直接挂载一个文件到容器, 使用文件编辑工具, 包括 vi 或者 sed --in--place 的时候, 可能会造成 inode 的改变, 从 Docker 1.1.0 起, 这会导致报错误信息. 所以推荐的方式是直接挂载文件所在的目录.
数据卷容器
如果用户需要在多个容器之间共享一些持续更新的数据, 最简单的方式是使用数据卷容器. 数据卷容器也是一个容器, 但是它的目的是专门用来提供数据卷提供其他容器挂载.
首先, 穿件一个数据卷容器 dbdata, 并在其中创建一个数据卷挂载到 /dbdata:
docker run -v /dbdata --name dbdata centos
//输出信息
c862196eb6abc857908fab5e61daac08c4e9518ab045bf7090ccde0e72b06c2e
然后, 可以在其他容器中使用 --volumes-from
来挂载 dbdata 容器中的数据卷, 例如创建 db1 db2 两个容器, 并从 dbdata 容器挂载数据卷:
docker run -it --volumes-from dbdata --name db1 centos
docker run -it --volumes-from dbdata --name db2 centos
此时, 容器 db1 和 db2 都挂载同一个数据卷到相同的 /dbdata 目录. 三个容器任何一方在该目录下的写入, 其他容器都可以看到.
也可以多次使用 --volumes-from
参数来从多个容器挂载多个数据卷. 还可以从其他已经挂载了容器卷的容器来挂载数据卷:
docker run -d --name db3 --volumes-from db1 centos
//输出信息
de3b36b50897f66f8e9aeaa64391dc7b883678efe5c4f81029fe351bde46d84e
使用
--volumes-from
参数所挂载数据卷的容器自身并不需要保持在运行状态.
如果删除了挂载的容器(包括 dbdata db1 和 db2), 数据卷并不会被自动删除. 如果要删除一个数据卷, 必须在删除最后一个还挂载着它的容器是显示, 可以使用 docker rm -v
命令来指定同时删除关联的容器.
使用数据卷容器可以让用户在容器之间自由的升级和移动数据卷.
利用数据卷容器来迁移数据
可以利用数据卷容器对其中的数据卷进行备份 恢复, 以实现数据的迁移.
1.备份
使用下面的命令来备份 dbdata 数据卷容器内的数据卷:
docker run --volumes-from dbdata -v $(pwd):/backup --name worker centos tar cvf /backup/backup.tar /dbdata
这个命令稍微有点复杂, 具体分析一下. 首先利用 centos 镜像创建了一个 worker 容器.
使用 --volumes-from dbdata
参数来让 worker 容器挂载 dbdata 容器的数据卷(即 dbdata 数据卷); 使用 -v $(pwd):/backup
参数来挂载本地的当前目录到 worker 容器的 /backup 目录.
worker 容器启动后, 使用了 tar cvf /backup/backup.tar /dbdata
命令来将 /dbbata 下内容备份为容器内的 /backup/backup.tar
, 即宿主主机当前目录下的backup.tar.
2.恢复
如果将数据恢复到一个容器, 可以按照下面的步骤操作.
首先创建一个带有数据卷的容器 dbdata2:
docker run -v /dbdata --name dbdata2 centos
然后创建另一个新的容器, 挂载 dbdata2 的容器, 并使用 untar 解压备份文件到所挂载的容器卷中:
docker run --volumes-from dbdata2 -v $(pwd):/backup busybox tar xvf /backup/backup.tar