分布式数据库技术基础:数据分片介绍

 

 

1、数据分片定义

数据分片也成为数据分割,是分布式数据库的特征之一。一般在一个分布式数据库中,全局数据库是由各个局部数据库逻辑组合而成的,反之各个局部数据库是由全局数据库的某种分割逻辑而得的。

数据分片得到的各部分元组成为该关系的逻辑片段,并被存放在相应的节点上。这样处理可以各得其所,大大减少网络上的通信,提高系统响应效率。

2、数据分片的方法介绍

2.1 水平分片

根据特定条件把全局关系的所有元组,划分成若干个互补相交的子集。每个子集为全局关系的一个逻辑片段。它们通过对全局关系施加选择运算得到,并且可以通过对这些片段执行合并操作来恢复全局关系。

2.2 垂直分片

把全局关系的属性分成若干个子集,对全局关系做投影运算得到这些子集。要求全局关系的每一个属性至少映射到一个垂直片段中,并且每一个垂直片段都包含该全局关系的关键字。这样通过这些片段执行连接操作可以恢复该全局关系。

2.3 水平和垂直结合的分片

可以先水平再垂直分片,也可以反向为之。

3、数据分片原则

  • 完备性条件:必须把全局关系的所有数据映射到各个片段中,绝不允许有属于全局关系却不属于任何一个片段的数据存在。

  • 可重构条件:必须保证能够由同一个全局关系的各个片段来重新构造该全局关系。对于水平分片可用并操作重构全局关系;对于垂直分片可以用连接操作重构全局关系。

  • 不相交条件:要求一个全局关系被分割后所得的各数据片段互补重叠或只包含关键字重叠。

 

IT技术分享社区

个人博客网站:https://programmerblog.xyz

文章推荐程序员效率:画流程图常用的工具程序员效率:整理常用的在线笔记软件远程办公:常用的远程协助软件,你都知道吗?51单片机程序下载、ISP及串口基础知识硬件:断路器、接触器、继电器基础知识

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/270958.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

分布式数据库技术基础:分布透明性相关知识

1、分布透明性介绍数据分布独立性:主要是指用户或用户程序使用分布式数据库如同使用集中式数据库那样,不必关系全局数据的分布情况。也就是说全局数据的逻辑分片、片段的物理位置分配、各场地数据库的数据模型等情况对用户和用户应用程序是透明的。因此分…

宏基4750网卡驱动linux,宏基4750g网卡驱动下载

宏基4750g网卡驱动是宏基笔记本上网驱动,驱动可以帮助用户体验便捷上网功能,只需要的双击驱动安装就可以完成,网卡驱动是笔记本必备程序,欢迎用户来当易网下载体验!驱动介绍Acer宏碁Aspire 4750G笔记本网卡驱动14.4.0.…

python request post 数组_[pve][python]用python3获取pve状态信息

手头的Proxmox VE集群和节点越来越多,需要考虑统一管理了,先定一个小目标——集中状态监控。以前写过检测ceph并用钉钉报警的bash脚本,这次换上洋气的方式,用python来通过pve的api获取其状态信息。首先参考proxmox官方的api(实际上…

分布式数据库管理系统介绍

1、分布式数据库管理系统分类综合型体系结构:主要是指在分布式数据库建立之前,还没有建立独立的集中式数据库管理系统,设计人员根据用户的需求,设计出一个全新的完整的数据库管理系统。联合型体系结构:主要是指每个节点…

linux中国用户,Linux中国 适合新用户的Linux

这个争论无疑给许多Linux用户带来了麻烦。争论的焦点一般不是哪个发行版是真正最适合新用户的,而是哪个发行版受这些争论者的喜爱。如果我们撇开个人喜爱,我们会看到更清楚的一面。但即使这样,明确的结论也会受到被新用户的需求和期望的影响。…

关于局部变量表slot的理解

看下图代码例子,double类型的b,占用两个slot,所以index为3和4

分布式查询处理和优化相关知识介绍

一、分布式数据库查询考虑的因素1、和集中式数据查询一样需要考虑查询语言语句的优化2、数据和信息均需要通过通信线路进行数据传输,存在传输延迟问题从而影响整个查询的执行效率。3、网络中多处理器的存在提供了并行数据处理和传输的机会,可以充分利用该…

操作数栈的字节码指令执行分析

一:写个demo 二:点击Recompile编译 三:使用javap命令反编译class文件 javap -v 类名.class 四:查看结果 五:分析执行过程 首先bipush意思是把byte类型的变量i的值15存放到操作数栈中,istore_1的意思…

分布式数据库基础:分布式事务相关概念介绍

1、事务的定义事务式访问数据库的一个逻辑工作单位,它属于一个操作序列,执行这个操作序列使数据库从一种一致状态转换到另外一种一致状态,从而实现特定业务的功能。2、分布式事务的定义分布式事务属于传统事务的扩展,分布式事务继…

windows比linux差在哪,怎么让新手理解Linux比Windows好在哪里!

pingpang2008 于 2009-06-17 08:54:31发表:人好多啊hantu 于 2009-06-16 23:28:57发表:哈哈,偏偏很多人就是不爽windows了才用Linux的刘冲 于 2009-06-16 21:44:08发表:linux比windows好吗?wayoking 于 2009-06-16 20:45:11发表:理解了,谢谢cscs2002 于 …

大型分布式存储方案MinIO介绍,看完你就懂了!

1、MinIO是什么?官方解释:MinIO 是一个基于Apache License v2.0开源协议的对象存储服务。它兼容亚马逊S3云存储服务接口,非常适合于存储大容量非结构化的数据,例如图片、视频、日志文件、备份数据和容器/虚拟机镜像等,…

部署好网站,同局域网中电脑无法访问的问题的解决方案

“部署好网站,同局域网中电脑无法访问的问题的解决方案"。 第一,Win7安装IIS后,本地测试没问题,说明IIS配置正确;如果本地测试有问题,先检查IIS安装配置情况。 第二,检查计算机网络情况&am…

linux下julia的开发环境,Ubuntu搭建Julia远程开发环境

Julia作为一门新兴的编程语言,还是可以学一学的,这里总结了一下Ubuntu系统远程搭建Julia开发环境的方法。前期准备:云服务器一台,操作系统为Ubuntu18.04,xshell6 vscode。环境安装;首先使用xshell远程连接云服务器&am…

ElementUI:文本框实现远程搜索的用法

❤️作者主页:IT技术分享社区 ❤️作者简介:大家好,我是IT技术分享社区的博主,从事C#、Java开发九年,对数据库、C#、Java、前端、运维、电脑技巧等经验丰富。 ❤️个人荣誉: 数据库领域优质创作者🏆&#x…

栈桢的结构

栈桢里面主要有局部变量表,操作数栈,方法返回地址,动态链接,和一些附加信息

Android事件总线

Android中Activity、Service、Fragment之间的相互通信比较麻烦,主要有以下一些方法: (1)使用广播,发送者发出广播,接收者接收广播后进行处理; (2)使用Handler和Message,如下载线程完成下载任务后&#xff0…

分布式数据库基础:分布式数据库故障

分布式数据库系统常见的故障主要有事务故障、系统故障、介质故障、网络引起的故障。事务故障:计算溢出、完整性破坏、操作员干预、输入输出报错等。介质故障:存放数据的介质发生的故障,比如磁盘、磁盘的损坏等等。系统故障:CPU出错…