文章目录
- 前言
- 一、事务
- 1.概念
- 2.定义语句
- 3.ACID特性
- 二、数据库恢复的必要性
- 1.为什么要进行数据库恢复
- 2.数据库恢复机制的作用
- 三、数据恢复使用的技术
- 1.数据转储
- 2.登记日志文件
- 四 、不同故障的数据恢复策略
- 1.事务内部的故障
- 2.系统故障
- 3.介质故障
- 五、具有检查点的恢复技术
- 1.检查点的意义
- 2.通过检查点确定的不同的恢复策略
前言
试图用最通俗易懂的语言整理数据库恢复这一章节的笔记,麻烦看官老爷点赞关注支持一下动力猿吧!
一、事务
1.概念
事务是用户定义的一个数据库操作序列,这些操作要么全做,要么全不做,是一个不可分割的工作单位。例如,在关系数据库中,一个事务可以是一条SQL语句、一组SQL语句或整个程序。
事务和程序是两个概念。一般地讲,一个程序中包含多个事务。
2.定义语句
在SQL 中,定义事务的语句一般有三条:
BEGIN TRANSACTION;
COMMIT;
ROLLBACK;
事务通常是以 BEGIN TRANSACTION 开始,以COMR
MIT或ROLLBACK结束。
COMMIT 表示提交事务的所有操作,意味着事务正常结束,将事务中所有对数据库的更新写回到磁盘上的物理数据库中去。
ROLLBACK表示回滚事务的所有操作,意味着事务运行的过程中发生了某种故障不能继续执行,系统将事务中对数据库的所有已完成的操作全部撤销回滚到事务开始时的状态。
上面所说的操作指对数据库的更新操作。
3.ACID特性
事务具有4个特性:原子性(Atomicity)、 一致性(Consisteney)、 隔离性(Isolation)和持续性(Durability)。 这4个特性简称为ACID特性。
(1)原子性:事务是数据库逻辑工作的最小单位,事务中的操作要么都做,要么都不做。
(2)一致性:事务执行的结果必须是使数据库从一个一致性状态变到另一个一致性状态。
当数据库只包含成功事务提交的结果时,就说数据库处于一致性状态。如果数据库系统运行中发生故障有事务被迫中断,这些事务虽然未成功完成,但是它们对数据库的修改有一部分也已经写入物理数据库,这时数据库就处于一种不一致的状态。
(3)隔离性:一个事务的内部操作及使用的数据对其他并发事务是隔离的,也就是说并发执行的各个事务之间不能相互干扰。
(4)持续性(永久性):一个事务一旦提交,它对数据库中数据的改变就应该是永久性的,接下来的其他操作或故障不应该对其执行结果有任何影响。
二、数据库恢复的必要性
1.为什么要进行数据库恢复
因此数据库管理系统必须具有把数据库从错误状态恢复到某一已知的正确状态(也称一致状态)的功能,这就是数据库的恢复。
2.数据库恢复机制的作用
(1)将数据库系统恢复到故障发生前数据库的某个一致的状态。
(2)保证事务的原子性、持久性。
(3)提供高可用性(将崩溃后的数据库的不可用时间减少到最低)。
三、数据恢复使用的技术
1.数据转储
(1)定义
数据库管理员定期将整个数据库复制到磁带磁盘等存储介质上保存起来,作为后备副本,当数据库被破坏时重装后备副本。
但重装后备副本只能使数据库恢复到转储时的状态,要想恢复到故障发生时的状态,必须重新运行自转储以后的所有更新事务。
(2)分类
按转储时能否继续操作数据库,可以将数据转储分为动态转储和静态转储。
按每次转储整个数据库还是仅转储上次转储后更新的数据,可以将数据转储分为海量转储和增量转储。
2.登记日志文件
(1)定义
日志文件是用来记录事务对数据库的更新操作的文件,有两种格式:以记录为单位、以数据块为单位。
我们主要了解以记录为单位的日志文件:
其中每个事务的开始 (BEGIN TRANSACTION)标记 / 结束(COMMIT 或 ROLLBACK)标记 / 更新操作都认为是一个日志记录。
每个日志记录的主要内容包括:事务标识、操作类型、操作对象、旧值、新值。
(2)作用
事务故障恢复和系统故障恢复必须用日志文件。
在动态转储方式中必须建立日志文件,后备副本和日志文件结合起来才能有效地恢复数据库。
在静态转储方式中也可以建立日志文件,当数据库毁坏后可重新装入后援副本把数据库恢复到转储结束时刻的正确状态,然后利用日志文件把已完成的事务进行重做处理,对故障发生时尚未完成的事务进行撤销处理。
(3)登记日志文件的原则
为保证数据库是可恢复的,登记日志文件时必须遵循两条原则:
登记的次序严格按并发事务执行的时间次序
必须先写日志文件,后写数据库
四 、不同故障的数据恢复策略
1.事务内部的故障
事务故障指事务在运行至正常终止点前被终止。
这种情况下恢复子系统应利用日志文件撤销此事务已对数据库进行的修改。
事务故障的恢复是由系统自动完成的。
恢复策略:
反向扫描(从后往前)日志文件,查找到该事务的更新操作即执行逆操作,如此直至读到此事务的开始标记。
2.系统故障
系统故障指造成系统停止运转的任何事件,使得系统要重新启动。
系统故障造成数据库不一致的原因有两个:未完成事务的更新可能已被写入数据库;已提交事务的更新可能还停留在缓冲区没来得及写入数据库。
系统故障的恢复是在系统重启时自动完成的。
恢复策略:正向扫描(从前往后)日志文件,找出在故障发生前已经提交的事务记入重做队列,同时找出故障发生时尚未完成的事务计入撤销队列。然后对撤销队列的各个事务进行撤销处理,对重做队列的各个事务进行重做处理。
3.介质故障
介质故障是最严重的一种故障,也就是外存故障(磁盘损坏、磁头碰撞等),磁盘上的物理数据和日志文件被破坏。
恢复方法是重装数据库,然后重做已完成的事务。
恢复策略:装入最新的数据库后备副本(离故障发生时刻最近的转储副本),使数据库恢复到最近一次转储时的一致性状态。然后装入相应的日志文件副本(转储结束时刻的日志文件副本),重做已完成的事务。
五、具有检查点的恢复技术
1.检查点的意义
检查点是对于登记日志文件的恢复技术来说的,我们知道日志文件中日志记录是按照时间先后顺序排列的,检查点就是在日志文件中某些地方插入的新记录,专门用来标记时间点的。
使用检查点方法可以改善恢复效率。比如当事务T在一个检查点之前提交,T对数据库所有的修改一定都已写入数据库,写入时间是在这个检查点建立之前或在这个检查点建立之时。这样在进行恢复处理时,没有必要对事务T执行重做操作。
2.通过检查点确定的不同的恢复策略
T1:事务在检查点之前提交,不要重做。
T2、T4:事务在检查点之后才提交,所以不能确定事务对数据库所做的修改在故障发生时是否已写入数据库,有可能还在缓冲区中,所以需要重做。
T3、T5:事务在故障发生时还未完成,所以予以撤销。