1、数据分布的定义
数据分布是指在分布式环境中通过合理分布数据,提高数据操作自然并行度,以达到最优的执行效率的目的。在构建分布式数据库系统运行环境时,必须考虑数据如何分布在系统的各个场地上。
数据分布主要关注的问题是在分布式数据中,如何合理的放置数据,从而使得相关数据之间的相对位置最合适。
2、数据分布的内容
数据分布的内容主要有数据位置存放问题、高效的数据划分问题两个方面。
数据位置存放问题:主要是研究如何把已经划分好的数据合理放置在网络上,以获得最优的执行效率,从而减少网络传输的数据量。
高效的数据划分问题:如何把数据合理的划分开,使得使用率最高的数据能被放置在性能最好的节点上。
3、数据分布的策略
3.1 集中式
所有的全局数据片都安排一个节点上。
优点:因为数据都存放在一个节点上,对数据的控制管理比较容易、数据的一致性、完整性能够得到保证。
缺点:节点负担太重,容易出现性能瓶颈、节点依赖性太强,如果该节点出现故障,将使整个系统崩溃、可靠性相对较差。对节点设备要求会很高。
3.2 分割式
所有全局数据有且只有一份,它们被分割出若干个逻辑片段,每个逻辑片段被分别指派在特定的节点上,对全局数据进行了划分。
优点:数据存储量大、存放在各个节点可以自治检索和修改数据、因为数据是分布在多个节点上的,如果部分节点出现故障,系统仍然可以运行、可靠性较好。
缺点:针对全局修改、查询等操作需要时间会比集中式长一些,因为数据在不同节点需要进行网络通信。
3.3 复制式
全局数据有多个副本,每个站点上都有完整的数据副本。
优点:系统可靠性较高、响应速度快、数据恢复很容易。
缺点:保持各个节点的同步修改操作要付出高昂的代价、数据冗余很大。
3.4 混合式
全局数据被划分为若干个数据子集,每个子集被放在不同的节点上,但任何一个节点上都没有保持全部的数据,根据数据的重要性决定各个数据子集副本的数量。
优点:兼顾了分割式和复制式的优点、灵活性好、可以提高系统的效率。
缺点:包括了分割式和复制式的复杂性。
IT技术分享社区
个人博客网站:https://programmerblog.xyz
文章推荐程序员效率:画流程图常用的工具程序员效率:整理常用的在线笔记软件远程办公:常用的远程协助软件,你都知道吗?51单片机程序下载、ISP及串口基础知识硬件:断路器、接触器、继电器基础知识