【转】数据库设计：物理结构设计

数据库物理设计阶段的任务是根据具体计算机系统(DBMS和硬件等)的特点，为给定的数据库模型确定合理的存储结构和存取方法。所谓的“合理”主要有两个含义：一个是要使设计出的物理数据库占用较少的存储空间，另一个对数据库的操作具有尽可能高的速度。

为了设计数据库的物理结构，设计人员必须充分了解所用DBMS的内部特征；充分了解数据系统的实际应用环境，特别是数据应用处理的频率和响应时间的要求；充分了解外存储设备的特性。数据库的物理结构设计大致包括：确定数据的存取方法、确定数据的存储结构。

物理结构设计阶段实现的是数据库系统的内模式，它的质量直接决定了整个系统的性能。因此在确定数据库的存储结构和存取方法之前，对数据库系统所支持的事务要进行仔细分析，获得优化数据库物理设计的参数。

对于数据库查询事务，需要得到如下信息：

l 要查询的关系。

l 查询条件(即选择条件)所涉及的属性。

l 连接条件所涉及的属性。

l 查询的投影属性。

对于数据更新事务，需要得到如下信息：

l 要更新的关系。

l 每个关系上的更新操作的类型。

l 删除和修改操作所涉及的属性。

l 修改操作要更改的属性值。

上述这些信息是确定关系存取方法的依据。除此之外，还需要知道每个事务在各关系上运行的频率，某些事务可能具有严格的性能要求。例如，某个事务必须在20秒内结束。这种时间约束对于存取方法的选择有重大的影响。需要了解每个事务的时间约束。

值得注意的是，在进行数据库物理结构设计时，通常并不知道所有的事务，上述信息可能不完全。所以，以后可能需要修改根据上述信息设计的物理结构，以适应新事务的要求。

1. 确定关系模型的存取方法

确定数据库的存取方法，就是确定建立哪些存储路径以实现快速存取数据库中的数据。现行的DBMS一般都提供了多种存取方法，如索引法、HASH法等。其中，最常用的是索引法。

数据库的索引类似书的目录。在书中，目录允许用户不必浏览全书就能迅速地找到所需要的位置。在数据库中，索引也允许应用程序迅速找到表中的数据，而不必扫描整个数据库。在书中，目录就是内容和相应页号的清单。在数据库中，索引就是表中数据和相应存储位置的列表。使用索引可以大大减少数据的查询时间。

但需要注意的是索引虽然能加速查询的速度，但是为数据库中的每张表都设置大量的索引并不是一个明智的做法。这是因为增加索引也有其不利的一面：首先，每个索引都将占用一定的存储空间，如果建立聚簇索引(会改变数据物理存储位置的一种索引)，占用需要的空间就会更大；其次，当对表中的数据进行增加、删除和修改的时候，索引也要动态地维护，这样就降低了数据的更新速度。

在创建索引的时候，一般遵循以下的一些经验性原则：

l 在经常需要搜索的列上建立索引。

l 在主关键字上建立索引。

l 在经常用于连接的列上建立索引，即在外键上建立索引。

l 在经常需要根据范围进行搜索的列上创建索引，因为索引已经排序，其指定的范围是连续的。

l 在经常需要排序的列上建立索引，因为索引已经排序，这样查询可以利用索引的排序，加快排序查询的时间。

l 在经常成为查询条件的列上建立索引。也就是说，在经常使用在WHERE子句中的列上面建立索引。

同样，对于某些列不应该创建索引。这时候应该考虑下面的指导原则：

l 对于那些在查询中很少使用和参考的列不应该创建索引。因为既然这些列很少使用到，有索引并不能提高查询的速度。相反，由于增加了索引，反而降低了系统的维护速度和增大了空间需求。

l 对于那些只有很少值的列不应该建立索引。例如，人事表中的“性别”列，取值范围只有两项：“男”或“女”。若在其上建立索引，则平均起来，每个属性值对应一半的元组，用索引检索，并不能明显加快检索的速度。

转载于:https://www.cnblogs.com/spring87/p/3693140.html

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/news/493277.shtml