数据库原理及应用【四】数据库管理系统

查询优化

数据库管理系统中非常重要的一部分。

代数优化

按照一定的规则将语句变化成关系代数以后进行优化

操作优化

对代数优化后的查询树使用比较好的方法进行查询。
主要是对连接运算进行优化

  • 嵌套循环
  • 归并扫描
  • 索引优化
  • 哈希连接

恢复机制

备份(完整备份+差异备份)+日志

事务

  • A:原子性
  • C:保持一致性
  • I:隔离性
  • D:持久性

事务的特性由DBMS负责维护,因此对于需要使用事务来进行执行的SQL语句,我们要定义在事务中。

如果没有显式地创建事务,那么DBMS会把每一条语句当作一个事务。

恢复信息

日志存储在非挥发存储器中。

  • Commit list:已经提交的TID的列表
  • Active list:进程中的TID列表
  • Log:更新前和更新后的信息。存储的是修改前后的物理块的值

提交(commit)规则:在提交事务之前修改后的数据A.I必须写到非挥发存储器中

先记后写(log ahead)规则:在修改数据前必须把被修改数据的旧值B.I写到日志中

操作:

  • 还原undo
  • 重做redo
    这两种操作具有幂等性:一次和和好多次是相等的

更新策略

A.I->DB before commit

TID->active list

B.I->Log
A.I->DB

TID->commit list
delete TID from active list
如果发生故障会启动重启动恢复:检查TID目前所处的状态

Commit listActive listOperation
NoYesundo,delete TID from active list
YesYesdelete TID from active list
YesNonothing to do

为了避免每次检查都需要检查所有的TID,使用检查点。
检查点(check point):运行一段时间以后进行一次检查,并且设立一个检查点。每次检查检查上一次检查点以后的TID

A.I->DB after commit

TID->active list

A.I -> Log

TID->commit list
ALL:A.I -> DB
delete TID from active list

重启动恢复:

Commit listActive listOperation
NoYesdelete TID from active list
YesYesredo, delete TID from active list
YesNonothing to do

这种策略的并发度更高。可以推迟加排他锁的时间。

A.I -> DB concurrently with commit

TID -> active list

A.I,B.I -> log

A.I->DB(partially done by 后台进程 when hard disk is free)

TID->commit list
A.I->DB(completed)
delete TID from active list

重启动恢复:

Commit listActive listOperation
NoYesundo, delete TID from active list
YesYesredo, delete TID from active list
YesNonothing to do
总结
redoundo
A.I->DB before commitNoYes
A.I->DB after commitYesNo
A.I->DB concurrently commitYesYes
异地更新(有缺点,没有被推广)NoNo

并发控制

并发:支持多个事务同时访问数据库
原因:

  • 改善系统的利用率
  • 不同的事务很可能访问的是不同的数据,互不冲突

并发控制:对事务的并发运行加以管理

任意并发的后果:

  • 丢失更新:写-写冲突
  • 读脏数据->恢复时的多米诺现象:写-读冲突
  • 不可重复的读:读-写冲突

可串行化:并发运行事务以后的结果如果和某种串行运行的结果相同,则说这种并发运行是可串行化的,即是正确的。

如果用户把一些事务同时提交并发运行,则要求这些事务谁先运行后运行是无所谓的,即默认所有可串行化的结果都是正确的。

并发控制策略

通过并发控制使得并发事务的运行是可串行化的

封锁法

通过锁对事务强行串行化

  • X锁协议(排他锁)

定义1:在一个事务里面,如果所有的加锁请求都在锁释放之前,称这个事务是一个两阶段事务,符合两阶段加锁协议。(增长阶段-缩减阶段)
定义2:先得到锁再访问数据对象,那么这个事务就是well-formed(合式的)
定义:如果每个事务是合式的两阶段事务,那么这些事务一定是可串行化的。
如果事务是合式的并且是两阶段事务,并且在事务结束的时候释放更新锁,那么这个事务是可串行化的、可恢复的。不会出现恢复的时候的多米诺效应
如果在事务结束的时候释放所有的锁,那么称这个事务满足严格的两阶段加锁协议。

NLX
NLYY
XYN

数据库效率比较低。

  • SX锁协议
    S(hare) lock :如果是读操作
    X lock:如果是更新操作
NLSX
NLYYY
SYYN
XYNN
  • S(share)U(update)X locks
NLSUX
NLYYYY
SYYYN
UYYNN
XYNNN

系统的并发度较高。

死锁/活锁(饥饿)
在这里插入图片描述
活锁/饥饿:优化调度策略

死锁:
  • 防:防止出现死锁
  • 治:出现死锁以后能够解决死锁。
治:
  • 当事务获得锁以后的等待时候超过一个限度以后就判定已经发生了死锁,就重启事务。对于时间的设置影响系统的运行效率
  • 构造等待图
    节点:等待的事务
    边:等待关系
    如果在等待图里面出现环就说明出现死锁。

检查时机:每次出现新的等待关系的时候/周期检查
解决方法:选择一个牺牲者(目前拥有锁最小的/滚回代价最小的事务)。然后等待环路上的其他事务都运行结束以后再运行该事务。

操作系统中的解决方案:

  • 检查所需要的所有资源
  • 给资源进行排序

在数据库系统中不现实

多粒度加锁

  • 一旦遇到得不到锁就终止,不等待就不会死锁
  • 事务重试:给每一个事务安排一个时间戳
    • 当作TID
    • 比较两个事务的年龄

等待死亡协议
如果Ta需要申请一个锁,这个锁已经被Tb占领了:

  • 如果Ta比Tb年老,则Ta进行等待
  • 如果Ta比Tb年轻,则自己终止,然后自动重新运行(以原来的时间戳)

因此不可能重现循环等待,解决了死锁和活锁问题
受伤等待协议
如果Ta需要申请一个锁,这个锁已经被Tb占领了:

  • 如果Ta比Tb年轻,则Ta进行等待
  • 如果Ta比Tb年老的话,则将Tb终止

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/383608.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

数据库原理及应用【五】安全性和完整性约束

数据库一致性被破坏: 系统故障许多用户的并发访问人为破坏事务本身不正确 保护数据库一致性的方法: 视图/查询修改访问控制 普通用户拥有资源特权的用户DBA 数据库的安全问题 身份验证 口令物理设备 GRANT CONNECT TO John IDENTIFIED BY 123456…

递归式复杂度求解

代换法 猜测复杂度验证是否满足递归式(使用归纳法)找到常数应该满足的条件针对基本情况,常数足够大时总是成立的 需要注意的是,我们猜测的复杂度有可能不满足递归式,这个时候就要通过减去一些低阶项来使得归纳成立。…

斐波那契数列计算

定义 斐波那契数列: F[n]{0,n01,n1F[n−1]F[n−2],elseF[n] \begin{cases} 0,n0 \\ 1,n1\\ F[n-1]F[n-2],else \end{cases} F[n]⎩⎪⎨⎪⎧​0,n01,n1F[n−1]F[n−2],else​ 朴素计算法 根据递归式F[n]F[n−1]F[n−2]F[n]F[n-1]F[n-2]F[n]F[n−1]F[n−2]进行计算…

P、NP、NP完全问题、NP难问题

可以在多项式时间内求解的问题称为易解的,而不能在多项式时间内求解的问题称为难解的。 P类问题:多项式类型,是一类能够用(确定性的)算法在多项式的时间内求解的判定问题。 只有判定问题才属于P 不可判定问题&#…

数据可视化【十】绘制地图

Loading and parsing TOPOJSON 导入Topojson d3文件 地址:https://unpkg.com/topojson3.0.2/dist/topojson.min.js 想要找d3文件的话去unpkg.com好像大部分都能找到的样子 Rendering geographic features 寻找合适的地图数据:谷歌搜索world-atlas npm…

数据可视化【十一】树状图

Constructing a node-link tree visualization 首先将节点之间的连线画出来。 使用json函数读取文件以后,使用hierarchy等函数得到连线的数组,然后绑定这个数组,给每个元素添加一个path,绘画使用的是一个函数linkHorizontal&…

数据可视化【十二】 颜色图例和尺寸图例

有了前面的知识,制作一个图例应该不是很难,关键是我们想要制作一个可以在其他地方进行使用的图例,这样就需要能够动态地设置图例的大小,位置,等等。 这里直接上代码: colorLegend.js export const color…

数据可视化【十三】地区分布图

在前面的博客中已经介绍了如何绘制地图,这一节学习如何绘制地区分布图。如果对绘制地图还不熟悉的话可以了解一下之前我写的博客:数据可视化【十】绘制地图 Intergrating(整合) TopoJSON with tabular data(列表数据) 在前面的博客中没有使用到tsv文件…

3.01【python正则表达式以及re模块】

python正则表达式以及re模块 元字符 正则表达式的语法就由表格中的元字符组成,一般用于搜索、替换、提取文本数据 元字符含义.匹配除换行符以外的任何单个字符*匹配前面的模式0次或1次匹配前面的模式1次或多次?匹配前面的模式0次或1次[]用于定义字符集&#xff…

Linux配置编程环境+云服务器上传文件

Java环境配置 Ubuntu https://www.cnblogs.com/lfri/p/10437266.html Centos https://blog.csdn.net/qq_21077715/article/details/85536399 Tomcat配置 Centos https://blog.csdn.net/qq_21077715/article/details/85541685 https://www.cnblogs.com/newwind/p/9904561…

gbd + cgbd

gbd:传送门 cgbd:传送门 | 传送门

数据可视化【十四】交互式过滤地区分布图

在前面的博客中已经介绍了如何绘制地区分布图,这一节学习如何绘制交互式过滤地区分布图。如果对绘制地区分布图还不熟悉的话可以了解一下之前我写的博客:数据可视化【十三】地区分布图 整体的框架仍然是在之前的基础上进行修改,主要是添加交…

Ubuntu环境搭建

本文记录了一些常用的Ubuntu软件 然后首先修改软件源:软件和更新->Ubuntu软件->下载自:其他站点(修改为阿里云) 在关闭的时候需要更新什么的 然后修改更新方式,将不支持的更新去掉 常用的Windows软件 网易云…

1 两数之和

虽然只是一道很简单的题,但是也给我很多思考。 刚看到这道题的时候没有仔细思考,直接写了个排序和二分查找,想着对每个数字查找另一个数字会不会出现,复杂度是O(nlognnlogn)O(nlognnlogn)O(nlognnlogn),主要训练了一下…

834 树中距离之和

这道题我自己的想法只有对每个点都用一遍Dijkstra然后再求和,显然会超时,所以我都没有尝试。 研究了一下题解,发现题解很巧妙,自己对树的处理还是太稚嫩,之前树链剖分学的都忘光了。 对于固定根节点的,我…

75 颜色分类

题目已经提示可以一遍扫描了但是我还是没有想到,其实双指针的想法我已经有了,但是一想到有问题就觉得无法实现。这也揭示了我思维上的问题:用一种方法解决问题遇到困难第一件事情不是想着如何攻克而是想着换一种方法。对自己的思维也不自信。…

141 环形链表

要求使用空间复杂度为O(1)的方法,可是我并没有想到。我想到的只有用一个哈希表记录一下所有访问过的节点。 题解给出的空间复杂度为O(1)的方法是使用两个指针,然后让一个一次跑一步,一个一次跑两步,如果跑的快的能追上跑的慢的就…

数据可视化【十五】

经验法则:在颜色不相邻的时候加上背景颜色颜色的个数为6~12比较好。 颜色其实很大程度上由背景决定而不是他本身决定。 D3 Scale-Chromatic 有许多颜色刻度,可以根据自己的需要进行选择。 参考论文:Practical Rules for Using Color in Cha…

Ubuntu修改/删除主目录下的中文文件夹

在Ubuntu的主目录下一般是有一些中文的目录,例如桌面,视频等等,还无法修改名称,在一群英文文件夹里面显得有些突兀(Ubuntu终端下的中文一点也不好看),就想把这些文件夹修改一下,结果…

19 删除链表的倒数第N个

题目的意思很简单,就是删除一个链表倒数第N个节点。 需要用到链表的标准操作:快慢指针。 我们让一个快指针先指向第N个元素,这个时候快指针总比慢指针领先N个元素,等到快指针指向链表尾部的时候慢指针就指向需要删除的元素。 之前…