目录
2.1.1 关系
关系:概念
1. 域(Domain)
2.笛卡尔积
元组(Tuple)
分量(Component)
基数(Cardinal number)
3. 关系
候选码(Candidate key)
主码(Primary key)
全码(All-key)
主属性(Prime attribute)与非主属性(Non-Prime attribute)
三类关系
基本关系的性质
2.1.2 关系模式 数据库系统概论
1.什么是关系模式
2.定义关系模式
关系模式与关系
2.1.3 关系数据库
2.1.4 关系模型的存储结构
2.1.1 关系
单一的数据结构----关系,现实世界的实体以及实体间的各种联系均用关系来表示。
逻辑结构----二维表,从用户角度,关系模型中数据的逻辑结构是一张二维表。
关系:概念
关系模型是建立在集合代数的基础上.
1. 域(Domain)
域是一组具有相同数据类型的值的集合。
2.笛卡尔积
域上的一种集合运算;
定义:给定一组域 𝐷1,𝐷2, … ,𝐷𝑛,允许其中某些域是相同的, 则𝐷1,𝐷2, … ,𝐷𝑛的笛卡尔积为: D1×D2×…×Dn = 𝑑1, 𝑑2, … , 𝑑𝑛 𝑑𝑖 ∈ 𝐷𝑖 , 𝑖 = 1,2, … , 𝑛}
所有域的所有取值的一个组合;元素不能重复(集合)
个人理解:前组属性值的一个元组配对后一个的全部元组。类似于排列。
例子:给出3个域:D1=导师集合SUPERVISOR={张清玫,刘逸}; D2=专业集合SPECIALITY={计算机专业,信息专业}; D3=研究生集合POSTGRADUATE={李勇,刘晨,王敏};
元组(Tuple)
笛卡尔积中每一个元素 𝑑1, 𝑑2, … , 𝑑𝑛 叫作一个n元组(简称元组)例:(张清玫,计算机专业,李勇) 等都是元组。
分量(Component)
笛卡尔积元素 𝑑1, 𝑑2, … , 𝑑𝑛 中的每一个值di 叫作一个分量。张清玫、计算机专业、李勇、刘晨等都是分量。
基数(Cardinal number)
若Di(i=1,2,…,n)为有限集,其基数为mi(i=1,2,…, n),则D1×D2×…×Dn的基数M为:
一个域允许的不同取值个数,可用于描述笛卡尔积空间的大小。
个人理解:就是域理论上能产出多少组合。(多个域比如3个域那就把这三个域里的属性个数乘起来)
3. 关系
定义:D1×D2×…×Dn的子集叫作在域 𝐷1,𝐷2, … ,𝐷𝑛上的关系, 表示为 R( 𝐷1,𝐷2, … ,𝐷𝑛 )
R:关系名,n:关系的目或度(Degree)
关系是笛卡尔积的有限子集
关系中的每个元素是关系中的元组,通常用t表示。
当 n=1 时 , 称 该关系为单元关系( Unary relation )或一元关系,当n=2时,称该关系为二元关系(Binary relation)。
关系也是一个二维表,表的每行对应一个元组,表的每列对应一 个域。
关系中不同列可以对应相同的域,为了加以区分,必须对每列起一个名字,称为属性(Attribute)
n目关系必有n个属性
例:“导师”与“研究生”所在的域都是人名,可以取相同的域
码
候选码(Candidate key)
若关系中的某一属性组的值能唯一地标识一个元组,则称该属性组为候选码。
主码(Primary key)
若一个关系有多个候选码,则选定其中一个为主码。
例:学生没有重名时,学生关系中姓名、学号都可以是候选码。 可以选择候选码之一的学号作为主码。
全码(All-key)
极端的情况:关系模式的所有属性是这个关系模式的候选码,称为全码。
主属性(Prime attribute)与非主属性(Non-Prime attribute)
候选码的诸属性称为主属性;不包含在任何侯选码中的属性称为非主属性或非码属性
三类关系
基本关系:实际存在的表,是实际存储数据的逻辑表示
查询表:查询结果对应的表
视图表:由基本表或其他视图表导出的表,是虚表,不对应实际存储的数据
基本关系的性质
1.列是同质的:每一列中的分量是同一类型数据,来自同一个域.
2.不同的列可出自同一个域,其中的每一列称为一个属性,不同的属性要给予不同的属性名。
3.列的次序可以任意交换
4.任意两个元组的候选码不能相同
5.行的次序可以任意交换
6.分量必须取原子值(不可表中有表)
关系与笛卡尔积的区别:无限的关系在数据库中是无意义的。所以限定关系数据模型中的关系必须是有限集合。笛卡尔积的域不满足交换律,但是关系可以通过为其每个列附加一个属性名取消关系属性的有序性。
2.1.2 关系模式 数据库系统概论
1.什么是关系模式
关系模式(Relation Schema)是型,关系是值,关系模式是对关系的描述。
关系模式应当描述的内容:
元组集合的结构:属性构成,属性来自的域,属性与域之间的映象关系。
完整性约束条件。
2.定义关系模式
关系的描述称为关系模式,关系模式可以形式化地表示为:R(U,D,DOM,F)
R 关系名
U 组成该关系的属性名集合
D U中属性所来自的域
DOM 属性向域的映象集合
F 属性间数据的依赖关系的集合
关系模式通常可以简记为:R (U) 或 R (A1,A2,…,An ),R: 关系名,A1,A2,…,An : 属性名。
关系模式与关系
关系模式:对关系的描述,静态的、稳定的。
关系:关系模式在某一时刻的状态或内容;动态的、随时间不断变化的,在关系操作下不断更新。
关系模式和关系往往笼统称为关系
2.1.3 关系数据库
关系数据库:在一个给定的应用领域中,所有关系的集合构成一个关系数据库。
关系数据库的型与值
关系数据库的型: 又称关系数据库模式,是对关系数据库的描述。包括域的定义以及域上定义的若干关系模式。
关系数据库的值: 关系模式在某一时刻对应的关系的集合, 通常称为关系数据库。
2.1.4 关系模型的存储结构
关系数据库的物理组织(两种情况)
1.关系数据库管理系统中一个表对应一个操作系统文件,将物理数据组织交给操作系统完成。2.关系数据库管理系统从操作系统那里申请若干个大的文件, 自己划分文件空间,组织表、索引等存储结构,并进行存储管理。