数据库系统原理与实践 笔记 #7

文章目录

  • 数据库系统原理与实践 笔记 #7
  • 数据库设计和E-R模型(续)
    • 转换为关系模式
      • 具有简单属性的实体集的表示
      • 复合属性
      • 多值属性
      • 联系集的表示
      • 模式的冗余—合并
    • 实体-联系设计问题
      • 设计问题
      • 联系属性的布局
    • 扩展的E-R特性
      • 特化
      • 概化
      • 属性继承
      • 特化/概化的设计约束
      • 聚集
      • E-R图表示方法总结
      • E-R设计方案
    • UML
      • E-R图与UML类图对比
  • 关系数据库设计
    • 好的关系设计的特点
      • 设计选择1:更大的模式?
      • 设计选择2:更小的模式?
      • 有损分解
      • 无损分解的例子
    • 函数依赖
      • 函数依赖和码
      • 函数依赖是码的概化
      • 函数依赖的使用
      • 函数依赖相关术语
      • 函数依赖集的闭包
      • 函数依赖的路基蕴含
      • 函数依赖的推理规则
      • 属性闭包的应用

数据库系统原理与实践 笔记 #7

数据库设计和E-R模型(续)

转换为关系模式

  • 一个符合E-R模式的数据库可以表示为一些关系模式的集合
    • 实体集联系集都可以用表示数据库内容的统一的关系模式来表示
    • 每个实体集合联系集独有一个特有的关系模式与其对应,并分配相应的名字
    • 每个关系模式都有一些列,每个列多有唯一的名字

具有简单属性的实体集的表示

  • 从强实体集转换而来的模式与强实体集具有相同属性、主码
  • 从弱实体集转换的模式包含弱实体集的属性表示强实体集的主码
  • 该模式的主码由强实体集的主码与弱实体集的分辨符组合而成

复合属性

  • 复合属性通过为每个子属性创建单独的属性
    • 实体集instructor有复合属性name:由first_name, middle_name和last_name构成
    • 转化成关系模式后,该实体集具有name_first_name,name_middle_name和name_last_name

多值属性

  • 实体集E的多值属性M用一个独立的模式EM表示
  • 模式EM包含对应于的E主码及多值属性M的属性
  • 多值属性的每个值映射到关系模式EM的每一个独立元组
  • 不需要建立一个对应于实体集的模式,只需创建一个对应于多值属性的关系即可

联系集的表示

  • 联系集关系模式属性的选择
  • 联系集主码选择:二元联系集主码选择、多元联系集主码选择
  • 注意:需要为联系集的属性建立外码约束

模式的冗余—合并

  • 多对一和一对多的联系集的模式,如果“多”方参与是全部的,那么可以将 “多”方实体集和联系集的模式合并成单个包含两个模式所有属性并集的关系模式
  • 合并后模式加入原联系集的外码约束
  • 如果“多”方参与是部分的,也可以通过使用空值来进行模式合并。转换为关系模式时,联系集中 “一”方的相关属性应注意不能设置为not null
  • 在一对一联系的情况下,联系集的关系模式可以跟参与联系的任何一个实体集的模式进行合并
  • 一般而言,连接弱实体集与其标识强实体集之间的标识性联系集转换出的模式是冗余

实体-联系设计问题

设计问题

  • 常见错误:用一个实体集的主码作为另一个实体集的属性、将相关实体集的主码属性作为联系集的属性
    在这里插入图片描述

  • 如果注册信息还与其他实体集相联系,那么上述E-R设计更有效

  • 一般而言,通过创建一个实体集可以将非二元联系集转换为二元联系集

  • 所有的费二元联系集都可以用多个二元联系集来表示,但有时n元的联系集能够更清楚的表示几个参与的实体集之间的联系

联系属性的布局

  • 设计时将联系集的描述性属性作为联系集的属性还是实体集的属性这一选择应由映射基数约束决定

扩展的E-R特性

特化

  • 自顶向下设计过程:从初始实体集到一系列不同层次的实体子集的细化(具体化
  • 在实体集内部进行分组的过程称为特化
  • 子集中的实体在某些方面区别于实体集中的其他实体:这些子集成为了较低层的实体集,可能具有高层实体集不具有的属性、或者参与到高层实体集不参与的实体集
  • 特化通过从特化实体指向另一个实体的空心箭头来表示

概化

  • 自底向上设计过程:多个实体集根据共同具有的特征综合称一个较高层的实体集
  • 概化是高层实体集与一个或多个底层时提及间的包含关系
  • 概化是特化的逆过程,可互换使用
  • 它们在E-R图中的表示是相同的,区别在于不同的出发点和目标

属性继承

  • 属性继承—底层实体集继承了与其相关联的高层实体集的所有属性,并且继承地参与到其高层实体所参与的联系集中

特化/概化的设计约束

  • 成员资格判断约束:条件/属性定义的、用户定义的:用户将实体指派给某个实体集
  • 实体是否可以属于同一概化中的多个低层实体集的约束:不相交重叠
  • 完全性约束:定义高层实体集中的一个实体是否必须属性该概化的至少一个低层实体集:全部:每个高层实体必须属于一个低层实体集、部分:允许一些高层实体不属于任何低层实体集
  • 默认部分概化

聚集

  • 考虑我们之前看到的三元联系proj_guide,假设我们要记录某个项目中导师对学生的评价
    在这里插入图片描述

  • 为不引入冗余,用聚集来表示E-R模型,如下图所示:一个学生在一个指定的项目中由一个指定导师辅导;学生、导师、项目的组合可能有相关联的评价信息

E-R图表示方法总结

在这里插入图片描述

在这里插入图片描述

E-R设计方案

  • 实体或者属性表示一个对象
  • 实体集联系集更好地表达现实世界的概念
  • 强/弱实体集的使用
  • 概化/特化的使用—有助于模块化设计
  • 聚类的使用—将聚集实体集作为单一单元,不必考虑其内部结构

UML

  • UML(Unified Modeling Language): 统一建模语言
  • UML包含了将整个软件系统图形化的很多组件
  • UML类图与E-R图类似,仅有一些不同

E-R图与UML类图对比

在这里插入图片描述

在这里插入图片描述

关系数据库设计

好的关系设计的特点

设计选择1:更大的模式?

  • 通过E-R图转换得出一组关系模式后

  • 选择1:把一些关系模式合并为更大的关系,例如inst_dept(ID,name,salary,dept_name,building,budget)
    在这里插入图片描述

  • 如果通过E-R模型转换得出如下的两个关系模式sec_class(sec_id, building, room_number) and section(course_id, sec_id, semester, year)

  • 那么在逻辑设计中,我们可以将上述两个关系合并为如下关系:section(course_id, sec_id, semester, year, building, room_number),这样的关系模式不会产生数据冗余

设计选择2:更小的模式?

  • 如果通过E-R模型转换得出inst_dept关系模式,那么在逻辑设计中,我们可以将其分解为两个关系模式instructor(ID, name, salary, dept_name)department(dept_name, building, budget)
  • 这样可以避免(building, budget)的数据冗余
  • 可以通过如下一条规则:dept_name确定(building,budget)数据,即保持函数依赖:dept_name → \rightarrow building,budget
  • 由于dept_name在inst_dept关系中不是主码,因此需要将其拆分为更小的关系模式
  • 并不是所有的关系模式拆分都是有益的:
    • 例如,将employee(ID,name, street)分解为employee_attr1(ID, name)employee_attr2(name, street, city, salary)
  • name无法作为employee_attr2关系的主码,有可能会重名:无法通过分解出的employee_attr1employee_attr2重建(自然连接)得出原始关系
  • 我们称无法通过自然连接重建原始关系元组的分解为有损分解

有损分解

在这里插入图片描述

无损分解的例子

  • 无损分解(lossless decomposition)

  • R = ( A , B , C ) R=(A,B,C) R=(A,B,C)的分解: R 1 = ( A , B ) , R 2 = ( B , C ) R_1=(A,B),\ R_2=(B,C) R1=(A,B), R2=(B,C)
    在这里插入图片描述

  • r = ∏ A , B ( r ) ⋈ ∏ B , C ( r ) r = \prod_{A,B}(r)\bowtie \prod_{B,C}(r) r=A,B(r)B,C(r)

  • inst_dept分解为instructor和department关系是无损分解

函数依赖

  • 假设 r ( R ) r(R) r(R)是一个关系模式, α ⊆ R , β ⫅ R \alpha \subseteq R,\beta \subseteqq R αR,βR,模式R上的函数依赖
    α → β \alpha\rightarrow\beta αβ
  • 成立的条件是:如果对于任意关系实例r中任意两个元组 t 1 t_1 t1 t 2 t_2 t2,如果两者的属性(集) α \alpha α 的值相同,那么它们的属性(集) β \beta β 取值也相同。也就是:
    t 1 [ α ] = t 2 [ α ] ⇒ t 1 [ β ] = t 2 [ β ] t_1[\alpha] =t_2[\alpha] \Rightarrow t_1[\beta]=t_2[\beta] t1[α]=t2[α]t1[β]=t2[β]
  • α \alpha α函数确定 β \beta β β \beta β函数依赖于 α \alpha α

函数依赖和码

  • 超码:在某关系中,若一个或多个属性的集合 { A 1 , A 2 , . . . , A n } \{A_1, A_2,...,A_n\} {A1,A2,...,An}函数决定该关系中的其它全部属性,则称该关系的超码
  • 候选码:若集合 { A 1 , A 2 , . . . , A n } \{A_1, A_2, ..., A_n\} {A1,A2,...,An}任何真子集均不能函数决定该关系中的其它属性,则此时 { A 1 , A 2 , . . . , A n } \{A_1, A_2, ..., A_n\} {A1,A2,...,An}是最小的超码,即候选码
  • 外码:若关系模式R中属性或属性组X是另一个关系模式的主码,则称X是R的外码

函数依赖是码的概化

  • 函数依赖允许我们表达超码不能表达的约束,考虑下面的模式:inst_dept(ID, name, salary, dept_name, building, budget)

函数依赖的使用

  • 函数依赖在关系实例和关系模式上的体现区别:
    • 如果关系实例r咋函数依赖集F上合法,则称r满足F
    • 如果模式R上的所有合法关系实例都满足函数依赖集F,我们说F在关系模式R上成立
  • 注意:即使函数依赖并没有对关系模式 r ( R ) r(R) r(R)所有合法实例成立,这个关系模式的其中一个具体实例r可能满足函数依赖

函数依赖相关术语

  • 有些函数依赖被称为平凡(trivial) 的因为它们在所有关系中都是满足的
  • 例如:name → \rightarrow name,ID,name → \rightarrow ID
  • 通常,如果 β ⊆ α \beta \subseteq \alpha βα,那么 α → β \alpha \rightarrow \beta αβ平凡的函数依赖
  • α → β \alpha\rightarrow\beta αβ,但 β ⊈ α \beta\nsubseteq\alpha βα,则称 α → β \alpha\rightarrow\beta αβ非平凡的函数依赖
  • α → β \alpha\rightarrow\beta αβ,则称 α \alpha α为决定因素
  • 函数依赖 α → β \alpha\rightarrow\beta αβ称为部分依赖的条件是:存在 α \alpha α的真子集 γ \gamma γ,使得 γ → β \gamma\rightarrow\beta γβ

函数依赖集的闭包

  • 从给定函数依赖集f能够推导出的所有函数依赖的集合,我们称之为F集合的闭包
  • 我们用 F + F^+ F+来表示函数依赖集F的闭包

函数依赖的路基蕴含

  • 给定关系模式 r ( R ) r(R) r(R),如果 r ( R ) r(R) r(R)的每个满足F的实例也满足某个函数依赖f,则R上的函数依赖f逻辑蕴含于r上的函数依赖集F
  • 已知关系R上的函数依赖集T、F,如果对于该关系中满足F的每一个关系实例都满足T,则称函数依赖集F逻辑蕴涵函数依赖集F

函数依赖的推理规则

  • Armstrong公理
    • 如果 β ⊆ α \beta\subseteq\alpha βα,则有 α → β \alpha\rightarrow\beta αβ(自反律)
    • 如果 α → β \alpha\rightarrow\beta αβ,则有 γ α → γ β \gamma\alpha\rightarrow\gamma\beta γαγβ增补律
    • 如果 α → β \alpha\rightarrow\beta αβ β → γ \beta\rightarrow\gamma βγ,则有 α → γ \alpha\rightarrow\gamma αγ传递律
  • 附加定理:
    • 如果 α → β \alpha\rightarrow\beta αβ α → γ \alpha\rightarrow\gamma αγ,则有 α → β γ \alpha\rightarrow\beta\gamma αβγ(合并律)

    • 如果 α → β γ \alpha\rightarrow\beta\gamma αβγ,则有 α → β \alpha\rightarrow\beta αβ α → γ \alpha\rightarrow\gamma αγ(分解律)

    • 如果 α → β \alpha\rightarrow\beta αβ γ β → δ \gamma\beta\rightarrow\delta γβδ,则有 α γ → δ \alpha\gamma\rightarrow\delta αγδ伪传递律

属性闭包的应用

  • 超码的判断
  • 验证函数依赖
  • 计算F的闭包

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/132563.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

利用Graviton2和S3免费套餐搭建私人网盘

网盘是一种在线存储服务,提供文件存储,访问,备份,贡献等功能,是我们日常中不可或缺的一种服务。很多互联网公司都为个人和企业提供免费的网盘服务。但这些免费服务都有一些限制,比如限制下载速度&#xff0…

网络运维Day06

文章目录 磁盘空间管理一块硬盘的“艺术”之旅识别磁盘分区规划分区模式MBR(主启动记录模式)GPT分区 使用GPT分区方案分区 格式化与挂载使用格式化挂载使用 实现开机自动挂载实验 光盘挂载交换空间 总结 磁盘空间管理 磁盘空间管理 扇区默认512字节 一块硬盘的“艺术”之旅 …

领星ERP如何无需API开发轻松连接OA、电商、营销、CRM、用户运营、推广、客服等近千款系统

领星ERP(LINGXING)是一款专业的一站式亚马逊管理系统,帮助卖家构建完整的数据化运营闭环。,致力于为跨境电商卖家提供精细化运营和业财一体化的解决方案。 官网:https://erp.lingxing.com 集简云无代码集成平台&…

[NLP] LlaMa2模型运行在Mac机器

本文将介绍如何使用llama.cpp在MacBook Pro本地部署运行量化版本的Llama2模型推理,并基于LangChain在本地构建一个简单的文档Q&A应用。本文实验环境为Apple M1 芯片 8GB内存。 Llama2和llama.cpp Llama2是Meta AI开发的Llama大语言模型的迭代版本,…

02-React组件与模块

组件与模块 前期准备 安装React官方浏览器调试工具,浏览器扩展搜索即可 比如红色的React就是本地开发模式 开启一个用React写的网站,比如美团 此时开发状态就变成了蓝色 组件也能解析出来 何为组件&模块 模块,简单来说就是JS代…

系统架构设计师(第二版)学习笔记----层次式架构设计理论与实践

【原文链接】系统架构设计师(第二版)学习笔记----层次式架构设计理论与实践 文章目录 一、层次式体系结构概述1.1 软件体系结构的作用1.2 常用的层次式架构图1.3 层次式体系可能存在的问题点 二、表现层框架设计2.1 MVC模式2.1.1 MVC三层模式2.1.2 MVC设…

Zookeeper3.7.1分布式安装部署

上传安装文件到linux系统上面 解压安装文件到安装目录 [zhangflink9wmwtivvjuibcd2e package]$ tar -zxvf apache-zookeeper-3.7.1-bin.tar.gz -C /opt/software/3. 修改解压文件名 [zhangflink9wmwtivvjuibcd2e software]$ mv apache-zookeeper-3.7.1-bin/ zookeeper-3.7…

用HTML + javaScript快速完成excel表格信息除重并合并

今天突然接到一个工作,要把两个存储在.xls的主体信息表,除重后合并成一个主体信息表,并且补充主体类型和所在县区这两列信息。 完成这项工作的方法有很多,如果信息表中的信息量不大的话,手工处理一下也行,如…

Go语言用Colly库编写的图像爬虫程序

下面是一个使用Colly库编写的Go语言图像爬虫程序,该程序会爬取news.qq上的图片,并使用proxy_host:duoip和proxy_port:8000的爬虫IP服务器进行抓取。 package mainimport ("fmt""net/http""github.com/crawlab-collective/go-co…

top和jstack分析堆栈问题

1.top 在服务器上,我们可以通过top命令查看各个进程的cpu使用情况,它默认是按cpu使用率由高到低排序的 由上图中,我们可以找出pid为21340的java进程,它占用了最高的cpu资源 2. top -Hp pid 通过top -Hp 21340可以查看该进程下&…

AMEYA360荣获“国际潜力之星分销商”奖!

由全球电子技术领域知名媒体集团ASPENCORE主办的“全球电子元器件分销商卓越表现奖"颁奖典礼于2023年11月3日晚在深圳大中华喜来登酒店圆满结束! 全球电子元器件分销商卓越表现奖创办于2001 年,迄今已成功举办20年,此奖项旨在表彰支持电子产业发展的…

React实现一个拖拽排序组件 - 支持多行多列、支持TypeScript、支持Flip动画、可自定义拖拽区域

一、效果展示 排序: 丝滑的Flip动画 自定义列数 (并且宽度会随着屏幕宽度自适应) 自定义拖拽区域:(扩展性高,可以全部可拖拽、自定义拖拽图标) 二、主要思路 Tip: 本代码的CSS使用…

搭建WAMP网站教程(Windows+Apache+MySQL+PHP)

之前为了学习网络安全,从搭建网站学起,对网站运行有个初步的了解。 今天翻到了之前的笔记,顺手发到csdn上了。 搭建网站步骤 一、Apache 安装Apache,下载Apache之后把Apache解压,此处解压到C:\目录下 2.然后要记得安…

leetcode:2926. 平衡子序列的最大和 【树状数组维护最大前缀和】

题目链接 lc2926 题目描述 题目思路 定义b[i] nums[i] - i 目标是从b中找到一个非降子序列使得元素和最大 # b[i] nums[i] - i # 找到b的一个非降子序列使得元素和最大 # f[i]: 子序列最后一个数下标是i,对应的最大子序列 # f[i] max (max f[j], 0) nums[i] …

计算机编程软件编程基础知识,中文编程工具下载分享

计算机编程软件编程基础知识,中文编程工具下载分享 给大家分享一款中文编程工具,零基础轻松学编程,不需英语基础,编程工具可下载。 这款工具不但可以连接部分硬件,而且可以开发大型的软件,象如图这个实例…

idea集成测试插件替代postman

idea集成测试插件替代postman 兄弟萌,你再测试接口是否无bug是否流畅的时候是否还在使用“postman”来回切换进行测试呢? 页面切换进行测试,有没有感觉很麻烦呢? 打开postman,输入接口地址,有没有感觉很麻烦…

关于网站安全的一些讨论

互联网的普及和发展为企业和个人提供了巨大的机会,但同时也伴随着网络安全威胁的增加。网站被攻击是一个常见的问题,可能导致数据泄露、服务中断和声誉受损。在本文中,我们将探讨与网络安全紧密相关的因素,分析为什么网站容易受到…

阿里云安全恶意程序检测(速通一)

阿里云安全恶意程序检测 赛题理解赛题介绍赛题说明数据说明评测指标 赛题分析数据特征解题思路 数据探索数据特征类型数据分布箱型图 变量取值分布缺失值异常值分析训练集的tid特征标签分布测试集数据探索同上 数据集联合分析file_id分析API分析 特征工程与基线模型构造特征与特…

vcenter跨版本升级

vcenter跨版本升级(比如从6.7升级到7.0)1.如果您有VCHA,需要关闭移除 vCenter HA 配置 2. 一定要先做好VC的备份 将VC做一个内存快照以便备份 3.下载好后,在电脑上解压镜像ISO,进入这个文件夹运行程序,并…

性能优化之懒加载 - 基于观察者模式和单例模式的实现

一、引入 在前端性能优化中,关于图片/视频等内容的懒加载一直都是优化利器。当用户看到对应的视图模块时,才去请求加载对应的图像。 原理也很简单,通过浏览器提供的 IntersectionObserver - Web API 接口参考 | MDN (mozilla.org)&#xff0c…