持续更新。。。。。。。。。。。。。。。
【第2章】 信息技术发展
- 考情分析
- 2. 1信息技术及其发展
- 2.1.1 计算机软硬件-P50
- 1.计算机硬件
- 2.计算机软件-P51
- 2.1.2计算机网络
- 1.通信基础-P52
- 2.网络基础-P53
- 4.网络标准协议-P54
- 3.网络设备-P53
- 5.软件定义网络-P57
- 6.第五代移动通信技术-P58
- 2.1.3 存储和数据库
- 1.存储技术-P59
- 2.数据结构模型 -P61
- 3.常用数据库类型-P63
- 4.数据仓库-P64
引言:希望这篇文章能够成为参加软考考生的灯塔
考情分析
本章主要学习信息技术相关内容包括计算机软硬件、网络基础、存储与数据库、信息安全,以及新一代信息技术发展包括物 联网、云计算、大数据、区块链、人工智能、虚拟现实等相关内容。根据考纲要求,本章知识点仅涉及客观题,约3分左右。
2. 1信息技术及其发展
信息技术是以微电子学为基础的计算机技术和电信技术的结合而形成的,对声音、图像、文字、数字和各种传感信号的信息进行获取、加工、处理、存储、传播和使用的技术。按表现形态的不同,信息技术可分为硬技术(物化技术)与软技术(非物化技术),前者指各种信息设备及其功能,如传感器、服务器、智能手机、通信卫星、笔记本电脑等。后者指有关信息获取与处理的各种知识、方法与技能,如语言文字技术、数据统计分析技术、规划决策技术、计算机软件技术等。
2.1.1 计算机软硬件-P50
计算机硬件(Computer Hardware)是指计算机系统中由电子、机械和光电元件等组成的各种物理装置的总称。这些物理装置 按系统结构的要求构成一个有机整体,为计算机软件运行提供物质基础。计算机软件(Computer Software)是指计算机系统中的程 序及其文档,程序是计算任务的处理对象和处理规则的描述;文档是为了便于了解程序所需的阐明性资料。程序必须安装入机器内部才能工作,文档一般是给人看的,不一定安装入机器。
硬件和软件互相依存。 硬件是软件赖以工作的物质基础,软件的正常工作是硬件发挥作用的重要途径。
计算机系统必须要配 备完善的软件系统才能正常工作,从而充分发挥其硬件的各种功能。硬件和软件协同发展,计算机软件随硬件技术的迅速发展而发展,而软件的不断发展与完善又促进了硬件的更新,两者密切交织发展,缺一不可。随着计算机技术的发展,在许多情况下,计算机的某些功能既可以由硬件实现,也可以由软件来实现。因此硬件与软件在一定意义上说没有绝对严格的界线。
1.计算机硬件
计算机硬件主要分为:
控制器
、运算器
、存储器
、输入设备
和输出设备
。
- 1 控制器(Controller)
控制器根据事先给定的命令发出控制信息,使整个电脑指令执行过程一步一步地进行。
控制器是整个计算机的中枢神经
,其功能是对程序规定的控制信息进行解释并根据其要求进行控制,调度程序、数据和地址,协调计算机各部分的工作及内存与外设的访问等。控制器的具体功能主要是:从内存中取出一条指令,并指出下一条指令在内存中的位置,对指令进行译码或测试,并产生相应的操作控制信号,以便启动规定的动作;指挥并控制CPU、内存和输入/输出设备之间的数据流动方向。
-
- 运算器(Arithmetic Unit)
运算器的功能是对数据进行各种算术运算和逻辑运算,即对数据进行加工处理。运算器的基本操作包括加、减、乘、除四则运算,与、或、非、异或等逻辑操作,以及移位、比较和传送等操作,亦称算术逻辑部件(ALU)。 计算机运行时,运算器的操作和
操作种类由控制器决定,运算器接受控制器的命令而进行动作,即运算器所进行的全部操作都是由控制器发出的控制信号来指挥的。
-
- 存储器(Memory)
存储器的功能是存储程序、数据和各种信号、命令等信息,并在需要时提供这些信息。存储器分为:
计算机内部的存储器(简 称内存)
和计算机外部的存储器(简称外存)
。内存储器从功能上可以分为: 读写存储器RAM、只读存储器ROM两大类
; 计算机的外存储器一般有:软盘和软驱、硬盘、光盘等,以及基于USB接口的移动硬盘、可擦写电子硬盘(优盘)等。计算机存储容量以字节为单位,它们是:
字节B(1Byte =8bit)、
千字节KB(1KB=1024B)、
兆字节MB(1MB=1024KB)、
吉字节GB(1GB=1024MB)、
太字节TB(1TB=1024GB)。
-
- 输入设备(Input Device)
输入设备是计算机的重要组成部分,输入设备与输出设备合称为外部设备,简称外设。输入设备的作用是将程序、原始数据、 文字、字符、控制命令或现场采集的数据等信息输入计算机。常见的输入设备有键盘、鼠标、麦克风、摄像头、扫描仪、扫码枪、
手写板、触摸屏等。
-
- 输出设备(Output Device)
输出设备也是计算机的重要组成部分,它把计算机的中间结果或最后结果、机内的各种数据符号及文字或各种控制信号等信
息输出出来。计算机常用的输出设备有显示器、打印机、激光印字机和绘图仪等。
2.计算机软件-P51
计算机软件分为系统软件、应用软件和中间件
。如果把计算机比喻为一个人的话,那么硬件就表示人的身躯,而软件则表示
人的思想与灵魂。 一台没有安装任何软件的计算机被称为“裸机”。
-
- 系统软件 (System Software)
系统软件是指控制和协调计算机及外部设备,支持应用软件开发和运行的系统,是无须用户干预的各种程序的集合,主要功 能是:①调度、监控和维护计算机系统;②负责管理计算机系统中各种独立的硬件,使得它们可以协调工作。系统软件使得计算机
使用者和其他软件将计算机当作一个整体而不需要顾及底层每个硬件是如何工作的。
-
- 应用软件 (Application Software)
应用软件是用户可以使用的各种程序设计语言以及用各种程序设计语言编制的应用程序的集合,分为
应用软件包
和用户程序
。
应用软件包是利用计算机为解决某类问题而设计的程序的集合,供多用户使用。应用软件是为满足用户不同领域、不同问题的应用需求而提供的软件。
-
- 中间件 (Middleware)
中间件是处于操作系统和应用程序之间的软件。它使用系统软件所提供的基础服务(功能),衔接网络上应用系统的各个部 分或不同的应用,能够达到资源共享和功能共享的目的。中间件是位于平台(硬件和操作系统)和应用之间的通用服务,这些服务 具有标准的程序接口和协议。针对不同的操作系统和硬件平台,不管底层的计算机硬件和系统软件怎样更新换代,只要将中间件进行升级和更新,并保持中间件对外的接口定义不变,应用软件几乎不需要进行任何修改,从而保证了应用软件的持续稳定运行。
2.1.2计算机网络
在计算机领域中,网络就是用物理链路将各个孤立的工作站或主机连接在一起,组成数据链路,从而达到资源共享和通信的 目的。计算机网络将地理位置不同并具有独立功能的多个计算机系统通过通信设备和线路连接起来,结合网络软件(网络协议、信息交换方式及网络操作系统等)实现不同计算机资源之间的共享。
1.通信基础-P52
通信是指人与人、人与自然之间通过某种行为或媒体进行的信息交流与传递。电(光)通信是指由一地向另一地进行信息的 传输与交换的传递过程。通信的目的是传递消息 (Message) 中包含的信息 (Information)。 连续消息是指消息的状态随时间变化而连续变化,如话音等;离散消息指消息的状态是离散的,如符号、数据等。
- 通信系统和模型
一个通信系统包括三大部分: 源系统(发送端或发送方)、传输系统(传输网络)和目的系统(接收端或接收方)
,如图2-1所示
- 现代通信的关键技术
从总体上看,通信技术实际上就是通信系统和通信网的相关技术。通信系统是指点对点通信所需的全部设施,而通信网是由许多通信系统组成的多点之间能相互通信的全部设施。而现代的关键通信技术有数字通信技术、信息传输技术、通信网络技术等。 ,
-
数字通信技术:是用数字信号作为载体来传输消息,或用数字信号对载波进行数字调制后再传输的通信方式。它可传输电报、数字数据等数字信号,也可传输经过数字化处理的语音和图像等模拟信号。
-
信息传输技术:是主要用于管理和处理信息所采用的各种技术的总称,它主要是应用计算机科学和通信技术来设计、开发、安装和实施信息系统及应用软件;它也常被称为信息和通信技术。
-
通信网络技术:是指将各个孤立的设备进行物理连接,实现人与人、人与计算机、计算机与计算机之间进行信息交换的链路,从而达到资源共享和通信的目的。
2.网络基础-P53
从网络的作用范围可将网络类别划分为个人局域网 (Personal Area Network, PAN)、 局域网 (Local Area Network,
LAN)、 城域网 (Metropolitan Area Network,MAN)、广域网 (Wide Area Network,WAN)。
-
个人局域网 (PAN) 。 个人局域网是指在个人工作的地方把属于个人的电子设备(如便携式电脑等)用无线技术连接起来的自组网络,因此也常称为无线个人局域网WPAN(Wireless PAN)。从计算机网络的角度来看, PAN 是一个局域网,其作用范围通常在10m左右。
-
局域网 (LAN) 。 局域网通常指用微型计算机或工作站通过高速通信线路相连(速率通常在10Mb/s 以上),其地理范围通常为1km 左右。通常覆盖一个校园、 一个单位、 一栋建筑物等。
-
城域网 (MAN)。 城域网的作用范围可跨越几个街区甚至整个城市,其作用距离约为5~50km。
-
广域网 (WAN)。 广域网使用节点交换机连接各主机,其节点交换机之间的连接链路一般是高速链路,具有较大的通信容量。 广域网的作用范围通常为几十公里到几千公里,可跨越一个国家或一个洲进行长距离传输数据。
从网络的使用者角度可以将网络分
为公用网
(Public Network)与专用网
(Priyate Network) 。
- 公用网。公用网指电信公司出资建造的面向大众提供服务的大型网络,也称为公众网。
- 专用网。专用网指某个部门为满足本单位的特殊业务工作所建造的网络,这种网络不向本单位以外的人提供服务,如电力、军队、铁路、银行等均有本系统的专用网。
4.网络标准协议-P54
网络协议是为计算机网络中的数据交换构建的规则、标准或约定的集合。网络协议由三个要素组成,分别是语义、语法和时序。
①语义是解释控制信息每个部分的含义,它规定了需要发出何种控制信息,完成的动作以及做出什么样的响应;
②语法是用户数据与控制信息的结构与格式,以及数据出现的顺序;
③时序是对事件发生顺序的详细说明。
人们形象地将这三个要素描述为:语义表示要做什么,语法表示要怎么做,时序表示做的顺序。
- OS|
国际标准化组织 (ISO) 和国际电报电话咨询委员会 (CCITT) 联合制定的开放系统互连参考模型 (Open System Interconnect,OSl), 其目的是为异构计算机互连提供一个共同的基础和标准框架,并为保持相关标准的一致性和兼容性提供共 同的参考。OSI采用了分层的结构化技术,从下到上共分为七层。
2. IEEE802 协议族
IEEE802规范定义了网卡如何访问传输介质(如光缆、双绞线和无线等),以及在传输介质上传输数据的方法,还定义了传输 信息的网络设备之间连接的建立、维护和拆除的途径。遵循IEEE802标准的产品包括网卡、桥接器、路由器以及其他一些用来建立
局域网络的组件。IEEE802规范包括一系列标准的协议族,其中以太网规范IEEE802.3是重要的局域网协议
,内容包括
- IEEE802.3 标准以太网 10Mb/s 传输介质为细同轴电缆
- IEEE802.3u 快速以太网 100 Mb/s 双绞线
- IEEE802.3z 千兆以太网 1000 Mb/s 光纤或双绞线
- TCP/IP (补充)
Internet 是一个包括成千上万相互协作的组织和网络的集合体。
TCP/IP是Internet 的核心
。TCP/IP在一定程度上参考了OSI, 它将OSI的七层简化为四层:
①应用层、表示层、会话层三个层次提供的服务相差不是很大,所以在TCP/IP中,它们被合并为应用 层一个层次。
②由于传输层和网络层在网络协议中的地位十分重要,所以在TCP/IP中它们被作为独立的两个层次。
③因为数据链路层和物理层的内容相差不多,所以在TCP/IP中它们被归并在网络接口层一个层次里。
TCP/IP 协议是互联网协议的核心
。 在应用层中,TCP/IP 协议定义了很多面向应用的协议,应用程序通过本层协议利用网络完
成数据交互的任务,这些协议主要有:
-
FTP(File Transfer Protocol,文件传输协议) 是网络上两台计算机传送文件的协议 ,其运行在TCP 之上,是通过Internet将文 件从一台计算机传输到另一台计算机的一种途径。FTP的传输模式包括Bin (二进制)和ASCII (文本文件)两种,除了文本文件之外,都应该使用二进制模式传输。
-
TFTP(Trivial File Transfer Protocol, 简单文件传输协议)是用来在客户机与服务器之间进行
简单文件
传输的协议,提供不复 杂、开销不大的文件传输服务。TFTP 建立在UDP(User Datagram Protocol, 用户数据报协议)之上,提供不可靠的数据流传输
服务,不提供存取授权与认证机制,使用超时重传的方式来保证数据的到达。 -
HTTP(Hypertext Transfer Protocol,
超文本
传输协议)是用于从WWW 服务器传输超文本到本地浏览器的传送协议。它可以使 浏览器更加高效,使网络的传输量减少。 HTTP 建立在TCP 之上,它不仅保证计算机正确快速地传输超文本文档,还可以确定传输文档中的哪一部分以及哪部分内容首先显示等。 -
SMTP(Simple Mail Transfer Protocol,简单邮件传输协议)建立在TCP 之上,是一种提供可靠且有效传输电子邮件的协议。SMTP 是建立在FTP 文件传输服务上的一种邮件服务,主要用于传输系统之间的邮件信息并提供与电子邮件有关的通知。
-
DHCP(Dynamic Host Configuration Protocol,动态主机配置协议)建立在UDP 之上,是基于客户机/服务器结构而设计的。 所有的IP网络设定的数据都由DHCP 服务器集中管理,并负责处理客户端的DHCP要求;而客户端则会使用从服务器分配下来的IP环境数据。 DHCP 分配的IP地址可以分为三种方式; 固定分配、动态分配和自动分配。
-
Telnet (远程登录协议)是登录和仿真程序,其建立在TCP 之上,它的基本功能是允许用户登录并进入远程计算机系统。 以前, Telnet 是一个将所有用户输入送到远程计算机进行处理的简单的终端程序。目前,它的一些较新的版本可以在本地执行更多的处理,可以提供更好的响应,并且减少了通过链路发送到远程计算机的信息数量。
-
DNS(Domain Name System, 域名系统)在Internet 上的域名与IP地址之间是一一对应的,域名虽然便于人们记忆,但机器之 间只能相互识别IP地址,它们之间的转换工作称为域名解析,域名解析需要由专门的域名解析服务器来完成, DNS就是进行域名解析的服务器。DNS通过对用户友好的名称来查找计算机和服务。
-
SNMP(Simple Network Management Protocol,简单网络管理协议)是为了解决Internet上的路由器管理问题而提出的,它 可以在IP、IPX、AppleTalk和其他传输协议上使用。SNMP是指一系列网络管理规范的集合,包括协议本身、数据结构的定义和一 些相关概念。目前, SNMP己成为网络管理领域中事实上的工业标准,并被广泛支持和应用,大多数网络管理系统和平台都是基于SNMP的。
- TCP 和UDP
在OSI的传输层有两个重要的传输协议,分别是TCP(Transmission Control Protocol,传输控制协议)和UDP(User Datagram Protocol, 用户数据报协议),这些协议负责提供流量控制、错误校验和排序服务。
- TCP 是整个TCP/IP 协议族中最重要的协议之一,它在IP协议提供的不可靠数据服务的基础上,采用了重发技术,为应用程序提供了一个
可靠的、面向连接的、全双工
的数据传输服务。TCP协议一般用于传输数据量比较少且对可靠性要求高
的场合。 - UDP 是一种
不可靠的、无连接
的协议,它可以保证应用程序进程间的通信,与TCP 相比, UDP 是一种无连接的协议,它的错误检测功能要弱得多。可以这样说, TCP有助于提供可靠性,而UDP则有助于提高传输速率。UDP 协议一般用于传输数据量大,对可靠 性要求不是很高
,但要求速度快的场合。
3.网络设备-P53
信息在网络中的传输主要有
以太网技术
和网络交换技术
。
网络交换是指通过一定的设备(如交换机等)将不同的信号或者信 号形式转换为对方可识别的信号类型,从而达到通信目的的一种交换形式,常见的有数据交换
、线路交换
、报文交换
和分组交换
。 在计算机网络中,按照交换层次
的不同,网络交换可以分为物理层交换
(如电话网)、链路层交换
(二层交换–对MAC地址进行变更)、网络层交换
(三层交换–对IP地址进行变更)、传输层交换
(四层交换–对端口进行变更) (比较少见)和应用层交换
。
在网络互连时,各节点一般不能简单地直接相连,而是需要通过一个中间设备来实现。按照OS|参考模型的分层原则,中间设
备要实现不同网络之间的协议转换功能。根据它们工作的协议层的不同进行分类, 网络互连设备有中继器
(实现物理层协议转换
在电缆间转换二进制信号)、网桥
(实现物理层和数据链路层协议转换)、路由器
(实现网络层和以下各层协议转换)、网关
(提供从最底层到传输层或以上各层的协议转换)和交换机等。
随着无线技术运用的日益广泛,目前,市面上基于无线网络的产品非常多,主要有无线网卡、无线AP、 无线网桥和无线路由器等。
5.软件定义网络-P57
问题:什么是软件定义网络?
正常情况来说,如果需要调整网络流量,需要调整交换机,但是在软件定义的网络中,网络工程师或管理员可以从中央控制 台调整流量,而无需接触网络中的各个交换机,无论服务器和设备之间的特定连接如何,集中式SDN 控制器都会指导交换机在任
何需要的地方提供网络服务。
软件定义网络 (Software Defined Network,SDN) 是一种新型的网络创新架构, SDN 是网络虚拟化的一种实现方式,它可 通过软件编程的形式定义和控制网络,其将网络设备的
控制面
与数据面
分离开来,从而实现了网络流量的灵活控制,使网络变得更 加智能,为核心网络及应用的创新提供了良好的平台。SDN 被认为是网络领域的一场革命,为新型互联网体系结构研究提供了新的
实验途径,也极大地推动了下一代互联网的发展。SDN的整体架构由下到上(由南到北)分为数据平面
、控制平面
和应用平面
。
控制平面与数据平面之间通过SDN控制数据平面接口进行通信,它具有统一的通信标准,主要负责将控制器中的转发规则下 发至转发设备,最主要应用的是OpenFlow 协议。控制平面与应用平面之间通过SDN北向接口进行通信,而NBI并非统一标准,它允许用户根据自身需求定制开发各种网络管理应用。
SDN 中的接口具有开放性,以控制器为逻辑中心,南向接口负责与数据平面进行通信,北向接口负责与应用平面进行通信,
东西向接口负责多控制器之间的通信。
6.第五代移动通信技术-P58
第五代移动通信技术(5thGeneration Mobile Communication Technology,5G) 是具有高速率、 低时延等特点的新一代移
动通信技术。
国际电信联盟 (ITU) 定义了5G的八大指标,与4G的对比如表2-2所示。
在频段方面,与4G支持中低频不同,考虑到中低频资源有限,5G 同时支持中低频和高频频段,其中中低频满足覆盖和容量需
求,高频满足在热点区域提升容量的需求,5G 针对中低频和高频设计了统一的技术方案,并支持百兆Hz 的基础带宽。
通过
网络切片
满足5G差异化需求,网络切片是指从一个网络中选取特定的特性和功能,定制出的一个逻辑上独立的网络,它
使得运营商可以部署功能、特性服务各不相同的多个逻辑网络,分别为各自的目标用户服务,目前定义了3种网络切片类型,即增 强移动宽带、低时延高可靠、大连接物联网
。
国际电信联盟 (ITU) 定义了5G的三大类应用场景,即增强移动宽带 (eMBB)、 超高可靠低时延通信 (uRLLC) 和海量机器
类通信 (mMTC)。
2.1.3 存储和数据库
存储是计算机系统的重要组成部分 , 一般以存储器的方式存在 。 存储器的主要用途是存放程序和数据 , 程序是计算机操作的依据 , 数据是计算机操作的对象 。
数据库是数据的仓库,是长期存储在计算机内的有组织的、可共享的数据集合。它的存储空间很大,可以存放百万条、千万条、上亿条数据。但是数据库并不是随意地将数据进行存放,而是有一定的规则的,否则查询的效率会很低。
存储和内存技术对数据库操作产生了巨大影响。存储和数据库系统一直处于相同的发展曲线。随着时间的流逝, SQL
(Structured Query Language,结构化查询语言)数据库已经从垂直可扩展的系统发展为NoSQL(Not only SQL,非关系型)数
据库,后者是水平可扩展的分布式系统。同样,存储技术已经从垂直扩展的阵列发展到水平扩展的分布式存储系统。
1.存储技术-P59
存储分类根据服务器类型分为封闭系统的存储和开放系统的存储。封闭系统主要指大型机等服务器。开放系统指基于包括麒 麟、欧拉、UNIX、Linux等操作系统的服务器。开放系统的存储分为内置存储和外挂存储。外挂存储根据连接方式分为直连式存储 (Direct Attached Storage,DAS) 和网络化存储 (Fabric Attached Storage,FAS)。网络化存储根据传输协议又分为网络接入存储 (Network Attached Storage,NAS) 和存储区域网络 (Storage Area Network,SAN)。
- DAS (直连式存储)
DAS也可称为SAS(Server Attached Storage, 服务器附加存储)。DAS被定义为直接连接在各种服务器或客户端扩展接口下的数据存储设备,它依赖于服务器,其本身是硬件的堆叠,不带有任何存储操作系统。在这种方式中,存储设备是通过电缆(通常是SCSI接口电缆)直接到服务器的, I/O (输入/输入)请求直接发送到存储设备。
- NAS (网络接入存储)
NAS 也称为网络直联存储设备或网络磁盘阵列,是一种专业的网络文件存储及文件备份设备,它是基于LAN (局域网)的,按 照TCP/IP协议进行通信,以文件的I/O方式进行数据传输。 一个NAS里面包括核心处理器、文件服务管理工具以及一个或者多个硬盘驱动器,用于数据的存储。
- SAN (存储区域网络)
SAN是一种通过光纤集线器、光纤路由器、光纤交换机等连接设备将磁盘阵列、磁带等存储设备与相关服务器连接起来的高
速专用子网。
SAN 由三个基本的组件构成:
接口(如SCSI、 光纤通道、 ESCON 等)、连接设备(交换设备、网关、路由器、集线 器等)和通信控制协议(如IP 和SCSI等 )
。这三个组件再加上附加的存储设备和独立的SAN 服务器,就构成了一个SAN 系统。
SAN主要包含
FCSAN
和IPSAN
两 种 ,FCSAN的网络介质为光纤通道 (Fibre Channel),IP SAN使用标准的以太网。采IPSAN
可以将SAN为服务器提供的共享特性以及IP网络的易用性很好地结合在一起,并且为用户提供了类似服务器本地存储的较高性能体验 。
DAS、NAS、SAN 等存储模式之间的技术与应用对比如表2-3所示。
- 存储虚拟化
存储虚拟化(Storage Virtualization) 是“云存储”的核心技术之一
,它把来自一个或多个网络的存储资源整合起来,向用户提供一个抽象的逻辑视图,用户可以通过这个视图中的统一逻辑接口来访问被整合的存储资源。
存储虚拟化使存储设备能够转换为逻辑数据存储。虚拟机作为一组文件存储在数据存储的目录中。数据存储是类似于文件系 统的逻辑容器。它隐藏了每个存储设备的特性,形成一个统一的模型,为虚拟机提供磁盘。存储虚拟化技术帮助系统管理虚拟基础
架构存储资源,提高资源利用率和灵活性,提高应用正常运行时间
。
- 绿色存储
绿色存储 (Green Storage) 技术是指从节能环保的角度出发,用来设计生产能效更佳的存储产品,降低数据存储设备的功耗,
提高存储设备每瓦性能的技术。
绿色存储技术的
核心
是设计运行温度更低的处理器和更有效率的系统,生产更低能耗的存储系统或组件,降低产品所产生的
电子碳化合物,其最终目的
是提高所有网络存储设备的能源效率,用最少的存储容量来满足业务需求,从而消耗最低的能源。以绿色理念为指导的存储系统最终是存储容量、性能和能耗三者的平衡。
绿色存储技术涉及所有存储分享技术,包括磁盘和磁带系统、服务器连接、存储设备、网络架构及其他存储网络架构、文件
服务和存储应用软件、重复数据删除、自动精简配置和基于磁带的备份技术等,可以提高存储利用率、降低建设成本和运行成本的
2.数据结构模型 -P61
数据结构模型是数据库系统的核心。 数据结构模型描述了在数据库中结构化和操纵数据的方法,模型的结构部分规定了数据
如何被描述(例如树、表等)。模型的操纵部分规定了数据的添加、删除、显示、维护、打印、查找、选择、排序和更新等操作。
常见的数据结构模型有三种:层次模型
、网状模型
和关系模型
。层次模型和网状模型又统称为格式化数据模型
。
- 层次模型
层次模型是数据库系统最早使用的一种模型,它用“树”结构表示实体集之间的关联,其中实体集(用矩形框表示)为结点, 而树中各结点之间的连线表示它们之间的关联。在层次模型中, 每个结点表示一个记录类型(例如:系/教研室等), 记录类型之 间的联系用结点之间的连线(有向边)表示,这种联系是父子之间的一对多的联系,这就使得层次数据库系统只能处理一对多的实体联系。每个记录类型可包含若干个字段,这里记录类型描述的是实体,字段描述实体的属性(例如:系编号/系名等)。
在层次模型中,有且只有一个结点没有双亲结点,这个结点称为根节点,同一双亲的子女结点称为兄弟结点,没有子女结点
的结点称为叶结点。层次模型的一个基本的特点是任何一个给定的记录值只能按其层次路径查看,没有一个子女记录值能够脱离双
- 网状模型
现实世界中事物之间的联系更多的是
非层次关系的
, 一个事物和另外的几个都有联系,用层次模型表示这种关系很不直观,网状模型克服了这一弊病,可以清晰地表示这种非层次关系。这种用有向图结构表示实体类型及实体间联系的数据结构模型称为网 状模型。网状模型突破了层次模型不能表示非树状结构的限制,两个或两个以上的结点都可以有多个双亲结点,将有向树变成了有向图
。
网状模型中以
记录
作为数据的存储单位。记录包含若干数据项。网状数据库的数据项可以是多值的和复合的数据。每个记录
有一个唯一标识它的内部标识符,称为码(Data base Key,DBK), 它在一个记录存入数据库时由数据库管理系统(DataBase
Management System,DBMS)自动赋予。DBK可以看作记录的逻辑地址,可作记录的“替身”或用于寻找记录。网状数据库是导
航式(Navigation) 数据库,用户在操作数据库时不但说明要做什么,还要说明怎么做。例如在查找语句中不但要说明查找的对象,
而且要规定存取路径。
- 关系模型(数据库系统最常用)
关系模型是在关系结构的数据库中用
二维表格
的形式表示实体以及实体之间的联系的模型。关系模型是以集合论中的关系概
念为基础发展起来的。关系模型中无论是实体还是实体间的联系均由单一的结构类型关系来表示。
关系模型允许设计者通过数据库规范化的提炼,去建立一个信息一致性的模型。访问计划和其他实现与操作细节由DBMS 引擎 来处理,而不反映在逻辑模型中。关系模型的基本原理是信息原理,即所有信息都表示为关系中的数据值。 所以,关系变量在设计时是相互无关联的;反而,设计者在多个关系变量中使用相同的域,如果一个属性依赖于另一个属性,则通过
参照完整性
来强制这种依性。
- 关系模型-参照完整性
例如,如果在学生表和选修课之间用学号建立关联,学生表是主表,选修课是从表,那么,在向从表中输入一条新记录时,
系统要检查新记录的学号是否在主表中已存在,如果存在,则允许执行输入操作,否则拒绝输入,这就是参照完整性。
参照完整性还体现在对主表中的删除和更新操作,例如,如果删除主表中的一条记录,则从表中凡是外键的值与主表的主键 值相同的记录也会被同时删除,将此称为级联删除;如果修改主表中主关键字的值,则从表中相应记录的外键值也随之被修改,将
此称为级联更新。
参照完整性的体现:不可以在表二中插入“200103”数据,因为值“200103”在主表中不存在加入“200103”数据破坏了 完整性的原则,也就是破坏了多表间 (A 表主码=B表外码)的一致性。不同的表相同的列名的数据保持不变,不能单独增加,就算要增加(或删除)也要同时增加(或删除)。
3.常用数据库类型-P63
数据库根据存储方式可以分为
关系型数据库
(SOL)和非关系型数据库
(NoSOL)。
- 关系型数据库
网状数据库和层次数据库已经很好地解决了数据的集中和共享问题,但是在数据独立性和抽象级别上仍有很大欠缺。用户在 对这两种数据库进行存取时,仍然需要明确数据的存储结构,指出存取路径。为解决这一问题,关系型数据库应运而生,它采用了
关系模型作为数据的组织方式。
关系数据库是在一个给定的应用领域中,所有实体及实体之间联系的集合。
关系型数据库支持事务的ACID原则,即原子性 (Atomicity)、一致性(Consistency)、隔离性(Isolation)、持久性(Durability), 这四种原则保证在事务过程当中数据的正确性
。
- 非关系型数据库
非关系型数据库是分布式的、非关系型的、不保证遵循ACID原则的数据存储系统。NoSOL 数据存储不需要固定的表结构,通常也
不存在连接操作。在大数据存取上具备关系型数据库无法比拟的性能优势。非关系型数据库的主要特征包括:
常见的非关系数据库分为:
-
键值数据库。类似传统语言中使用的哈希表。可以通过key来添加、查询或者删除数据库,因为使用key主键访问,所以会获得很高的性能及扩展性。Key/Value模型对于信息系统来说,其优势在于简单、易部署、高并发,例如redis。
-
列存储 (Column-oriented) 数据库。列存储数据库将数据存储在列族中, 一个列族存储经常被一起查询,如人们经常会查询某 个人的姓名和年龄,而不是薪资。这种情况下姓名和年龄会被放到一个列族中,薪资会被放到另一个列族中。这种数据库通常用来应对分布式存储海量数据,例如, HBASE。
-
面向文档 (Document-Oriented) 数据库。文档型数据库可以看作是键值数据库的升级版,允许之间嵌套键值。文档型数据库比键值数据库的查询效率更高。面向文档数据库会将数据以文档形式存储,例如,mogoDB。
-
图形数据库。图形数据库允许人们将数据以图的方式存储。实体会被作为顶点,而实体之间的关系则会被作为边。比如有三个实体:Steve Jobs、Apple和Next, 则会有两个Founded by的边将Apple和Next连接到Steve Jobs。
- 不同类型数据库的优缺点
关系型数据库和非关系型数据库的优缺点如表2-4所示
4.数据仓库-P64
传统的数据库技术在联机事务处理中获得了成功,但缺乏决策分析所需的大量历史数据信息,因为传统的数据库一般只保留 当前或近期的数据信息。为了满足人们对预测、决策分析的需要,在传统数据库的基础上产生了能够满足预测、决策分析需要的数
据环境-数据仓库。
数据仓库是一个面向主题的
、集成的
、非易失的
、且随时间变化的
数据集合,用于支持管理决策。
常见的数据仓库的体系结构:
- 数据源
数据源是数据仓库系统的基础,是整个系统的数据源泉。通常包括企业内部信息和外部信息。内部信息包括存放于关系型数
据库管理系统中的各种业务处理数据和各类文档数据。外部信息包括各类法律法规、市场信息和竞争对手的信息等。
- 数据的存储与管理
数据的存储与管理是整个数据仓库系统的核心。数据仓库的真正关键是数据的存储和管理。数据仓库的组织管理方式决定了 它有别于传统数据库,同时也决定了其对外部数据的表现形式。要决定采用什么产品和技术来建立数据仓库的核心,则需要从数据 仓库的技术特点着手分析。针对现有各业务系统的数据进行抽取、清理并有效集成,按照主题进行组织。数据仓库按照数据的覆盖
范围可以分为企业级数据仓库和部门级数据仓库(通常称为数据集市)。
- 联机分析处理(OnLine Analytical Processing,OLAP)服务器
OLAP 服务器对分析需要的数据进行有效集成,按
多维模型
予以组织,以便进行多角度、多层次 的分析,并发现趋势。其具体
实现可以分为:
基于关系数据库的OLAP(Relational OLAP,ROLAP),ROLAP基本数据和聚合数据均存放在RDBMS 之中;
基于多维数据组织的MOLAP(Multidimensional OLAP,MOLAP),MOLAP基本数据和聚合数据均存放于多维数据库中;
基于混合数据组织的OLAP(Hybrid OLAP,HOLAP),HOLAP基本数据存放于关系数据库管理系统(Relational Database Management System,RDBMS)之中,聚合数据存放于多维数据库中。
内容 | 地址 链接 |
---|---|
总览 | 【第三版】系统集成项目管理工程 |
十五至尊图 | 第三版 |
第一章 | 信息化发展 |
版本记录:
- 2024年5月4第一版