MySQL数据库备份策略与实践详解

目录

引言

一、MySQL数据库备份的重要性

(一)数据丢失的原因

(二)数据丢失的后果

二、MySQL备份类型

(一)根据数据库状态

(二)根据数据的完整性

(三)根据存储介质

(四)常见的备份方式

三、数据的备份与恢复

(一)物理冷备份

(二)mysqldump工具备份与恢复

1.库备份与恢复

1.1 备份数据库

1.2 恢复数据库

2.表的备份与恢复

2.1 备份表

2.2 恢复表

(三)二进制日志备份

1.开启二进制日志

2.完全备份

3.修改数据

4.模拟数据丢失

5.数据恢复

5.1 完全恢复

5.2 断点恢复

5.3 时间戳恢复

总结

(一)备份原理

(二)常用的备份方式

(三)制定备份策略

(四)注意点


引言

无论你是IT专业人士还是初次接触数据库管理的初学者,理解并掌握数据库备份技术都是非常关键的。备份不仅能够防止因硬件故障、软件错误、人为误操作等因素造成的损失,也是灾难恢复计划中的基石。

一、MySQL数据库备份的重要性

(一)数据丢失的原因

在生产环境中造成数据丢失的原因可能有很多种:

人为操作:在输入数据是命令错误导致数据丢失。

磁盘故障:比如由于物理磨损,导致磁盘出现坏道,造成数据丢失

服务BUG:由于数据量过大,导致MySQL服务出现逻辑错误,造成数据丢失

物理损坏:硬盘被盗、服务器物理损毁等

(二)数据丢失的后果

数据是企业的核心资产,一次意外的数据丢失可能导致业务停滞、客户信任度下降甚至法律纠纷。MySQL数据库备份就像是给企业数据买了一份保险,能够在危机时刻快速恢复业务运行。

二、MySQL备份类型

数据备份的类型可根据不同的标准进行分类

(一)根据数据库状态

根据备份时数据库的状态分为:

热备份:在数据库仍在运行的情况下进行备份,不影响正常的业务操作,适用于支持在线备份的数据库系统。

冷备份:在数据库完全关闭状态下进行的备份,这时的数据是静态的,不会发生变化,但会导致业务中断。

温备份:介于热备份与冷备份之间,数据库可能只允许读操作而不允许写操作,或者部分数据库实例处于待机模式。

(二)根据数据的完整性

根据备份数据时,数据的完整性,即备份策略可分为:

完整备份:顾名思义,就是备份数据库的全部数据。这是最直观也最全面的备份方式,适合数据量不大或者初期备份时使用。

增量备份:只备份自上次备份以来发生改变的数据。这种方式节省空间,但恢复时需要依次恢复所有增量备份。

差异备份:备份自上次完整备份以来所有变化的数据。相比增量备份,恢复时只需要最后一次完整备份和最后一次差异备份即可。

(三)根据存储介质

磁盘备份:传统的备份方式,用于大规模数据备份,现在依然在大型企业中有应用。

可移动存储备份:如U盘、光盘等。

本机多硬盘备份:利用计算机内部的多个硬盘进行备份

网络备份:通过网络将数据备份至远程服务器或其他网络存储设备。

(四)常见的备份方式

1.冷备份

数据库处于关闭状态,数据不会发生改变,从而保证数据的一致性,备份速度快,且不会存在任何中间状态,方法比较简单,虽然简单,但它只能用于数据库完全关闭时的状态恢复,无法做到实时备份

2.专用备份工具

mysqldump是MySQL自带的一个命令行工具,它可以生成数据库的SQL脚本,其中包括了创建表结构、插入数据等内容。

3.二进制日志备份

二进制日志记录了数据库的所有更改,可用于进行基于时间点的恢复或主从复制。启用二进制日志并在进行完整备份后,定期备份二进制日志文件,可以实现增量备份的效果。

4.第三方工具备份

对于InnoDB存储引擎的大规模数据库,可以使用Percona Xtrabackup工具进行热备份,它能实现在线备份,不影响数据库的正常使用。

MEB是Oracle官方提供的付费备份工具,支持在线热备份,适合大规模、高负载的生产环境。

三、数据的备份与恢复

(一)物理冷备份

首先关闭MySQL服务:systemctl stop mysqld.service

使用tar命令将文件压缩,而后进行解压恢复

使用tar命令将数据库文件进行压缩保存

将该数据库删除,模拟数据文件丢失

使用命令解压置MySQL的data目录下进行恢复

开启服务进行查看数据库文件

对于整个数据库系统同理,将mysql目录下的data目录进行压缩打包备份,而后进行恢复

删除数据库文件,模拟系统损坏

数据恢复后启动服务登录

(二)mysqldump工具备份与恢复

mysqldump工具备份与恢复严格意义上来说属于温备份,它可以在数据库服务运行的状态下进行备份,通过将备份文件中的SQL语句导入MySQL服务中来重新执行SQL语句,达到备份效果

首先使用mysql -u username  -p [password] -e   'SQL语句'来查看数据库的信息

-e:指令作用是在shell环境下不进入mysql服务,直接执行SQL语句,一般用于脚本文件

查看所有数据库名称

查看work库下的所有表

1.库备份与恢复

1.1 备份数据库
#mysqldump -u username -p [password] --databases database_name >backup_name.sql'-u [username]:指定MySQL用户名。'
'-p:提示输入密码。也可以直接在 -p 后面跟上密码(不推荐,因为命令行历史中可能会保存密码)'
'[database_name]:要备份的数据库名称。可以一个或者多个'
'>:重定向符号,将mysqldump命令的输出写入到文件中。'
'backup_name.sql:备份文件的名称,扩展名通常为.sql。'#mysqldump -u username -p [password] --databases 苦1 库2 > backup_filename.sql
'备份多个数据库'#mysqldump -u username -p [password] --all-databases > backup_filename.sql
'备份所有数据库'

首先进行数据的备份,比如想要备份work库,指定目录下生成备份文件

而后进行模拟丢失,将work库删除

1.2 恢复数据库

可以通过grep过滤出备份文件中的SQL语句

恢复的方式有两种

1.登录MySQL服务,使用source命令进行恢复

在MySQL服务中输入:source 备份文件


2.使用mysql命令进行恢复

使用:mysql -u username -p [password]  < 备份文件

将备份文件重定向输入到mysql当中

2.表的备份与恢复

#mysqldump -u username -p [password] [-d] database_name table_name >backup_name.sql'-u [username]:指定MySQL用户名。'
'-p:提示输入密码。也可以直接在 -p 后面跟上密码(不推荐,因为命令行历史中可能会保存密码)'
'[-d]:使用-d选项表示只备份表的结构,不使用-d表示表结构加数据一起备份'
'[database_name]:要备份的表的所在数据库名称。'
'[table_name]:要备份的表名称。'
'>:重定向符号,将mysqldump命令的输出写入到文件中。'
'backup_name.sql:备份文件的名称,扩展名通常为.sql。'#mysqldump -u username -p [password] [-d] database_name 表1 > backup_name.sql
'备份多张表'#mysqldump -u username -p [password] [-d] > backup_name.sql
'备份所有表'
2.1 备份表

分别备份两张表

可以使用grep命令过滤出备份文件的SQL语句

可以看到,备份的SQL语句中,使用-d与不使用备份的数据信息不一样,使用后,并没有将输入数据信息的SQL语句备份下来

表恢复的方式与库一样,可以使用source或者mysql命令恢复

首先删除两张表模拟数据丢失

2.2 恢复表

使用source恢复emp表

在登录mysql服务器输入:source /bak/emp_bak.sql

查看表的信息后发现,表的数据并没有恢复,而表结构保存了下来

使用mysql命令恢复emp_user表的数据

输入:mysql -u username -p [password]  database_name < 备份文件

需要注意的是,在备份的过程中,加不加--databases选项有些许区别

例如:

mysqldump -uroot -p123123 --databases  work  > /bak/work.sql
#这是备份整个库文件,包括库本身建库语句

mysqldump -uroot -p123123   work  > /bak/work.sql
#这是备份work库下所有的表,并不包括work库本身的建库语句

可以查看一下备份文件中的SQL语句

所以在进行数据恢复的时候会有区别

(三)二进制日志备份

MySQL的二进制日志(Binary Log)记录了数据库的所有更改,包括数据修改、DDL语句和其它重要事件。利用二进制日志进行备份,不仅可以实现数据恢复,还可以用于主从复制和数据审计等目的

MySQL的二进制日志备份通常并不意味着单独备份某个特定的.log文件,而是定期备份整个日志链中的一系列文件。

1.开启二进制日志

首先需要开启日志功能,在/etc/my.cnf文件中添加以下信息

log-error=/usr/local/mysql/data/mysql_error.log 
#这一行设置了MySQL错误日志文件的位置。general_log=ON 
#开启了MySQL的一般查询日志,这意味着所有对MySQL服务器执行的每一条SQL语句都将被记录下来,
#包括成功的查询、失败的查询以及连接和断开数据库的行为等。general_log_file=/usr/local/mysql/data/mysql_general.log 
#指定了MySQL一般查询日志的存储路径和文件名。log-bin=mysql-bin 开启了MySQL的二进制日志(Binary Log)
#这是一种用于复制和恢复的重要日志,记录了数据库的所有更改,包括数据修改、DDL语句等。slow_query_log=ON 
#开启MySQL慢查询日志,该日志记录执行时间超过一定阈值(long_query_time设置)的所有SQL查询slow_query_log_file=/usr/local/mysql/data/mysql_slow_query.log 
#设置了慢查询日志的存储路径和文件名。long_query_time=5 
#设置了慢查询的阈值,单位为秒。此配置下,任何执行时间超过5秒的SQL查询都会被记录到慢查询日志

添加之后重启MySQL服务:systemctl restart mysqld

可以使用:variables like 查看日志开启状况

variables 表示变量 like 表示模糊查询
#xxx(字段)
xxx% 以xxx为开头的字段
%xxx 以xxx为结尾的字段
%xxx% 只要出现xxx字段的都会显示出来
xxx   精准查询

重启后会在data/目录下生成四个日志文件

查看二进制日志文件

#--base64-output=decode-rows:使用64位编码机制去解码(decode)并按行读取(rows)
#-v: 显示详细内容
#--no-defaults : 默认字符集(不加会报UTF-8的错误)

在二进制日志文件中需要关注以下几个部分

#at sum :开始的位置点 
#end_log_pos sum:结束的位置
#时间戳: 240325 18:06:33  2024年3月25日 18时06分33秒
#SQL语句

2.完全备份

二进制日志文件,是对整个数据库文件进行增量备份,当数据有修改,删除,新建等操作时会记录到二进制日志当中,一般的查询语句不会记录

在开始使用二进制日志文件之前需要先进行完全备份,因为增量备份时基于完全备份实现的,它只记录修改后的信息,所以需要先进行完全备份

在完全备份后刷新日志信息,生成新的二进制文件,用于记载增量备份的数据信息

3.修改数据

而后进行数据的修改

可以看新的二进制日志文件中看到操作信息

也可以执行以下命令,将打印内容重定生成为txt文件,便于以后查看

mysqlbinlog --no-defaults --base64-output=decode-rows -v /bak/mysql-bin.000002 > /bak/mysql-bin_$(date +%F).000002.txt

此时再刷新,生成新的二进制日志文件(因为下一步需要模拟数据丢失,删除work库文件,此操作会计入二进制日志文件中,在使用二进制日志文件恢复数据时,依然会删除库)

4.模拟数据丢失

模拟数据丢失,删除库文件

5.数据恢复

5.1 完全恢复

直接使用二进制日志文件恢复会报错,因为它是基于完全备份后的增量备份,完全备份的数据是它的基础,在上面的操作中,对emp_user表进行添加三条数据,所以二进制日志文件,只记录了对表的一些操作语句,如果直接使用增量恢复,会因为找不到库文件与表而报错

所以首先需要进行完全备份的恢复

如果想将插入的三条数据全部恢复,需要将二进制日志文件mysql-bin.000002全部恢复即可

5.2 断点恢复

使用--stop-position与--start-position指令进行断点恢复

--stop-position='at值' 
#从开始值向下匹配,不设定--start-position,表示匹配到目标二进制日志文件的结尾--start-position='end_log_pos值'
#结束位置,不设定--stop-position,表示从目标二进制日志文件的开头匹配,到设定值结束

过滤出转换为txt格式后的二进制文件的开始值与结束值

同样删除原本的数据信息,将信息恢复到完全备份之前的状态

比如第五条信息出现错误,不想恢复第五条信息,想从第六条数据开始恢复,只需要将--start-position的值设为第六条数据的开始值即可

通过--stop-position选项可以恢复到想要的数值为止

比如只想恢复第五条数据可以添加--stop-position='结束值'进行恢复

首先找到需要恢复的信息的结束值

使用mysqlbinlog命令进行恢复

在没有设置主键或者唯一键的情况下可以多次恢复同一条数据

比如想再次恢复第六条数据,找到该数据的开始值与结束值

使用:mysqlbinlog --no-defaults --strat-position='at值' --stop-position='end_log_pos值' 进行恢复

5.3 时间戳恢复

基于时间戳恢复原理与断点恢复原理一致,将--stop-position与--start-position指令更改为

--stop-datetime与--start-datetime即可

--stop-datetime='at值' 
#从开始值向下匹配,不设定--start-datetime,表示匹配到目标二进制日志文件的结尾--start-datetime='end_log_pos值'
#结束位置,不设定--stopt-datetime,表示从目标二进制日志文件的开头匹配,到设定值结束

找到需要恢复的数据的开始时间戳与结束时间戳

恢复该条数据,使用--stop-datetime与--start-datetime选项

总结

本章知识点主要在于数据如何备份与恢复,在生产环境中,根据不同的信息或者服务状态,选择不同的备份恢复方式,能够达到特定的效果。

(一)备份原理

备份方式的基本原理,主要将库或者表的SQL语句进行备份,在数据恢复时,将SQL语句重新导入到MySQL服务当中,再次执行一遍SQL语句,达到数据恢复的效果

(二)常用的备份方式

1.冷备份

2.专用备份工具

3.二进制日志备份

4.第三方工具备份

(三)制定备份策略

在生产环境中,可以根据清空制定备份策略

定期备份:可根据数据变化频率设定每日、每周或每月的备份计划。

使用crontab -e,制定计划任务,来定期进行数据备份

比如每周六对wor库下emp_user表进行备份

0 1 * * 6  /usr/local/mysql/bin/mysqldump -uroot -pabc123 work emp_user > /bak/work_emp_user_$(date +%F).sql;/usr/local/mysql/bin/mysqladmin -u root -p flush-logs

也可以使用shell脚本进行备份

备份保留策略:根据法规要求和存储资源,确定备份文件的保留周期。

异地备份:将备份文件存放在不同的地理位置,以防单一地点的灾难事件

(四)注意点

1.在进行完全备份与恢复时,要注意--databases与-d的选项的添加与不添加,如果业务需求,只要需要库加上库下所有表的表结构,那么--databases与-d选项都需要添加

2.在进行完全备份的数据恢复时,如果使用source命令恢复某一张表时,在登录到MySQL服务后,需要先进入表的所在库后,再执行source命令

3.在使用二进制日志进行备份时,需要首先进行完全备份

在进行日志备份时,需要根据具体要求,再进行备份,否则备份错误,导致数据库崩坏,反而造成严重后果,得不偿失。

总之,实施良好的MySQL数据库备份策略是保障数据安全的关键环节,希望大家能结合自身业务特点和资源条件,合理制定并执行备份计划,真正做到防患于未然,确保数据安全无忧。在实践中不断优化和完善备份方案,以应对各种可能的风险和挑战

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/770870.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

线程的状态:操作系统层面和JVM层面

在操作系统层面&#xff0c;线程有五种状态 初始状态&#xff1a;线程被创建&#xff0c;操作系统为其分配资源。 可运行状态(就绪状态)&#xff1a;线程被创建完成&#xff0c;进入就绪队列&#xff0c;参与CPU执行权的争夺。或因为一些原因&#xff0c;从阻塞状态唤醒的线程…

CCF-CSP认证考试 202212-2 训练计划 100分题解

更多 CSP 认证考试题目题解可以前往&#xff1a;CSP-CCF 认证考试真题题解 原题链接&#xff1a; 202212-2 训练计划 时间限制&#xff1a; 1.0s 内存限制&#xff1a; 512.0MB 问题背景 西西艾弗岛荒野求生大赛还有 n n n 天开幕&#xff01; 问题描述 为了在大赛中取得…

【Linux】进程的基本概念(进程控制块,ps命令,top命令查看进程)

目录 01.进程的基本概念 程序与进程 进程的属性 02.进程控制块&#xff08;PCB&#xff09; task_struct的内容分类 组织进程 03.查看进程 ps命令 top指令 在计算机科学领域&#xff0c;进程是一项关键概念&#xff0c;它是程序执行的一个实例&#xff0c;是操作系统的…

Mybatis的核心配置文件

MyBatis的全局配置文件mybatis-config.xml&#xff0c;配置内容如下&#xff1a; properties&#xff08;属性&#xff09;settings&#xff08;全局配置参数&#xff09;typeAliases&#xff08;类型别名&#xff09;typeHandlers&#xff08;类型处理器&#xff09;objectFa…

面试知识汇总——垃圾回收器(分代收集算法)

分代收集算法 根据对象的存活周期&#xff0c;把内存分成多个区域&#xff0c;不同区域使用不同的回收算法回收对象。 对象在创建的时候&#xff0c;会先存放到伊甸园。当伊甸园满了之后&#xff0c;就会触发垃圾回收。 这个回收的过程是&#xff1a;把伊甸园中的对象拷贝到F…

【物联网】Qinghub Kafka 数据采集

基础信息 组件名称 &#xff1a; kafka-connector 组件版本&#xff1a; 1.0.0 组件类型&#xff1a; 系统默认 状 态&#xff1a; 正式发布 组件描述&#xff1a;通用kafka连接网关&#xff0c;消费来自kafka的数据&#xff0c;并转发给下一个节点做相关的数据解析。 配置文…

网络七层模型之物理层:理解网络通信的架构(一)

&#x1f90d; 前端开发工程师、技术日更博主、已过CET6 &#x1f368; 阿珊和她的猫_CSDN博客专家、23年度博客之星前端领域TOP1 &#x1f560; 牛客高级专题作者、打造专栏《前端面试必备》 、《2024面试高频手撕题》 &#x1f35a; 蓝桥云课签约作者、上架课程《Vue.js 和 E…

如何忽略Chrome最小字号的限制

通过控制台调整字体大小时&#xff0c;可以发现即便设置了小于12px的字号&#xff0c;也并不会变小&#xff0c;这是因为Chrome默认最小字号为12px。 在Chrome设置中的外观选项卡中可以发现&#xff0c;默认字体是16px。将最小字号改为0&#xff0c;就能随意设置小于12px的字号…

spring boot商城、商城源码 欢迎交流

一个基于spring boot、spring oauth2.0、mybatis、redis的轻量级、前后端分离、防范xss攻击、拥有分布式锁&#xff0c;为生产环境多实例完全准备&#xff0c;数据库为b2b2c设计&#xff0c;拥有完整sku和下单流程的商城 联系: V-Tavendor

文件编辑命令—vim

1.vim vim 是vi的升级版本.vi 文件名(vi方向键用不了) vim 的官方网站 (welcome home : vim online) 自己也说 vim 是一个程序开发工具而不是文字处理软件。 2.安装vim sudo apt install vim 如果出错了:apt update:刷新软件源; 出现"无法获得锁 之类的"sudo rm 文件…

后端常问面经之并发

volatile 关键字 volatile关键字是如何保证内存可见性的&#xff1f;底层是怎么实现的&#xff1f; "观察加入volatile关键字和没有加入volatile关键字时所生成的汇编代码发现&#xff0c;加入volatile关键字时&#xff0c;会多出一个lock前缀指令”lock前缀指令实际上相…

2015年认证杯SPSSPRO杯数学建模D题(第二阶段)城市公共自行车全过程文档及程序

2015年认证杯SPSSPRO杯数学建模 D题 城市公共自行车 原题再现&#xff1a; 城市交通问题直接影响市民的生活和工作。在地形平坦的城市&#xff0c;公共自行车出行系统是一种很好的辅助手段。一般来说&#xff0c;公共自行车出行系统由数据中心、驻车站点、驻车桩、自行车&…

吴恩达深度学习笔记:浅层神经网络(Shallow neural networks)3.1-3.5

目录 第一门课&#xff1a;神经网络和深度学习 (Neural Networks and Deep Learning)第三周&#xff1a;浅层神经网络(Shallow neural networks)3.1 神经网络概述&#xff08;Neural Network Overview&#xff09;3.2 神经网络的表示&#xff08;Neural Network Representation…

【Java八股面试系列】中间件-Redis

目录 Redis 什么是Redis Redis解决了什么问题 Redis的实现原理 数据结构 String 常用命令 应用场景 List(列表) 常用命令 应用场景 Hash(哈希) 常用命令 应用场景 set(集合) 常见命令​编辑 应用场景 Sorted Set(有序集合) 常见命令​编辑 应用场景 数据持…

idea中gradle编译下运营main方法报CreateProcess error=206

问题描述 CreateProcess error206 文件名或扩展名太长 问题分析 解决方案 build.gradle文件里添加 buildscript {repositories {maven {url "https://plugins.gradle.org/m2/"}}dependencies {classpath "gradle.plugin.ua.eshepelyuk:ManifestClasspath:1.…

Pandas操作MultiIndex合并行列的Excel,写入读取以及写入多余行及Index列处理,插入行,修改某个单元格的值

Pandas操作MultiIndex合并行列的excel&#xff0c;写入读取以及写入多余行及Index列处理 1. 效果图及问题2. 源码参考 今天是谁写Pandas的 复合索引MultiIndex&#xff0c;写的糊糊涂涂&#xff0c;晕晕乎乎。 是我呀… 记录下&#xff0c;现在终于灵台清明了。 明天在记录下直…

【Spring】IoCDI详解

1. IoC详解 前面提到过IoC就是将对象的控制权交由Spring的IoC容器进行管理&#xff0c;由Spring的IoC容器创建和销毁bean&#xff0c;那么既然涉及到容器&#xff0c;就一定包含以下两方面功能&#xff1a; bean的存储bean的获取 1.1 类注解 Spring框架为了更好地服务应用程…

高效物联网连接技术创新:ECWAN边缘协同自组网的未来——基于ChirpLAN窄带扩频技术的无线混合组网

物联网是指将各种物理设备通过互联网进行连接和通信的技术。它是一个庞大的网络&#xff0c;由传感器、设备、网络和云服务组成&#xff0c;旨在实现对物体的远程监测、控制和数据采集。 基于ChirpLAN窄带扩频技术的无线混合组网协议ChirpLAN&#xff0c;ChirpLAN是基于其自有的…

http模块 获取http请求报文中的路径 与 查询字符串

虽然request.url已包含属性和查询字符串&#xff0c;但使用不便&#xff0c;若只需其中一个不好提取&#xff0c;于是用到了如下路径和字符串的单独查询方法&#xff1a; 一、获取路径 例如&#xff1a;我在启动谷歌端口时输入http://127.0.0.1:9000 后接了 "/search?k…

编译安装飞桨fastdeploy@FreeBSD(失败)

FastDeploy是一款全场景、易用灵活、极致高效的AI推理部署工具&#xff0c; 支持云边端部署。提供超过 &#x1f525;160 Text&#xff0c;Vision&#xff0c; Speech和跨模态模型&#x1f4e6;开箱即用的部署体验&#xff0c;并实现&#x1f51a;端到端的推理性能优化。包括 物…