数据库常见理论常见面试题(总结)

一、前言

    这里呢,博主会介绍一些平时关于数据库的理论的问题,比如数据库的三级模式两级映射、触发器、范式、存储过程、视图等等概念知识,但是像索引、事务、锁等内容,之前的文章就讲解过了,这里就不作过多的介绍了,有需要的小伙伴去我的主页找哦。

二、三级模式两级映像

先看一张图

如图所示我们可以看到从最终用户到物理数据库分为三级模式:所谓的三级模式分别指的是:外模式、概念模式以及内模式。

而两级映像指的是:外模式-概念模式映像、概念模式-内模式映像。

1、三级模式:

①外模式:面向应用程序,描述用户的数据视图(View)。用户不同的需求得到不同的视图。

比如:有一张user表字段如图所示(一张基础表)

假设我现在只想得到username、password、nickname、sex这些字段,那我就可以通过在基础表上执行一些SQL语句,得到一个只包含这些字段的一个视图(View)。这样一来,这是面向用户的,不同需求的用户,得到的视图也是不一样的。

外模式的主要特点用来描述组成用户视图各个记录的组成、相互联系、数据的完整性和安全性、数据项的特征等。

②:概念模式(模式、逻辑模式):面向数据库设计人员,描述数据的整体逻辑结构。

比如,在如上图中,关于user表的设计,如表的一些性质,字段(id、username)等信息的设置(设计表的过程),其实就是在设置逻辑结构。

概念模式是数据库中全体数据的逻辑结构和特征的描叙是所有用户数据的公共数据视图

③:内模式(物理模式、储存模式):面向物理上的数据库(数据在磁盘中如何存储),描述数据库采用什么样的数据结构和怎样获得数据的。

2、两级映像:

定义了模式之间如何去转换。

①:外模式-概念模式映像:就是外模式向概念模式的转化,体现了逻辑独立性。所谓逻辑独立性是指我们修改了概念模式的基础表,但外模式却不受影响。

如图所示,我们修改基本表1和基本表2中的内容,当不会影响到视图(外模式)的查询,‘编号’、‘商品分类’、‘销量’,.....这些字段依然是使用于我们数据的查询到的。

②:概念模式-内模式映像:就是概念模式向内模式的转化过程,体现了物理的独立性。所谓物理的独立性指修改了内模式,不影响外层的概念模式和外模式。

例如:在Excel文件中将xls文件另存为xlsx文件,虽然更换了文件格式,但是打开文件后显示的表格的内容是不会改变的。

三、三大范式

为什么需要数据规范化?

如果没有数据规范化,我们的数据库表在设计时,可能会出现信息重复、更新异常、删除异常(删除了一个表,另一个表有的信息没有删除)、插入异常(无法正常显示信息)等问题,如果要避免这些问题就需要提到我们的三大范式。

1、范式概念

为了建立冗余较小、结构合理的数据库,设计数据库时必须遵循一定的规则。在关系型数据库中这种规则就称为范式。范式是符合某一种设计要求的总结。要想设计一个结构合理的关系型数据库,必须满足一定的范式。

2、第一范式(1NF)

数据库表中的所有字段都是不可分割的原子。

如何理解呢?

其实,很简单,比如我们的user表中有个address字段,那我们可以试想一下,我们在填写地址的时候,就直接在address下写“四川省成都市武侯区新华路121号”吗?其实我们是将address分为province(省份)、city(城市)、detail_address(详细地址)这三个部分,因为有时候系统会经常访问province、city这些字段,而且这样的才分,更加满足字段的原子性。

3、第二范式(2NF)

第二范式的实现是基于第一范式的,指的是数据库表中的每一列都与主键完全相关,而不能只与主键的部分相关。

如何理解呢?

如图所示,假设我们的主键是(货物类型、货物ID),此时“货物名称”是是与主键的名称完全相关的,但“注意事项”只是与主键中的“货物类型”部分相关。所以这个表对的设计是不合我们的第二范式的。要想修改的符合第二范式,就只需要将“注意事项”这列去除,剩余的数据列形成的表就是符合我们第二范式的了。如下图所示:

4、第三范式(3NF)

第三范式的成立是需要满足第一、第二范式的,是指第三范式需要确保数据表中的每一列数据都和主键直接相关,而不能间接相关。

如何理解呢?

如上图所示,我们的student表中,学号是主键,姓名、性别、家庭人口是指的是学生的个人信息是直接依赖于主键的,而班主任性别、班主任年龄是直接依赖的是班主任姓名,所以是不符合第三范式的。做成如下的表,就可满足第三范式:

5、数据库表设计必须遵循三范式吗

其实,我们说了三大范式的一些基本内容,也知道使用三大范式的好处,但是实际的项目开发中并不是必须严格遵守三大范式,因为范式虽然规范,但是性能就不会那么高。

比如:阿里规范开发手册里面就强调关联的表不能超过三张表,而我们遵循三大范式,必然会把一张表拆成很多张。

在真实项目开发中需要常用做法:

①所以考虑到商业化的需求和目标时,对成本以及用户体验来说,数据库的性能就更加重要;

②在规范性能问题的时候,需要适当考虑一下规范性;

③有时需要给某些表增加一些冗余的字段,为了将多表查询改为单表查询。

四、存储过程

1、概念

存储过程(PROCEDURE)指的是事先编译好,存储在数据库中的一段SQL语句集合。我们自需要创建一次,但在以后的该程序中可以调用多次。

2、优点:

①:存储过程可以重复使用,调用这些存储过程,可以减少开发人员的工作量;

②:减少网络流量,存储过程是位于数据库上,我们调用的时候只需要传递存储过程的名称和参数即可,降低了网络传输的流量。

③:安全性提高,参数化的过程,可以防止SQL注入问题。

3、缺点:

①:移植性差:存储过程写在数据库中,维护起来比较困难。

②:开发和维护要求高:存储过程的编写直接依赖于开发人员,如果业务逻辑改动较多,需要频繁直接操作数据库,大量业务降维到数据库,很多异常不能在代码中捕获,出现问题较难排查,需要数据库管理人员的帮助。

五、触发器

1、概念

触发器(TRIGGER)是由事件来触发某个操作。这些事件包括insert语句、update语句、delete语句(DML操作)。当数据库执行这些事件时,就会激活触发器执行相应的操作。当然也可以把触发器可以看作是一种特殊类型的存储过程,它与存储过程的区别在于存储过程中使用时需要调用,而触发器是在预先定义好的事件(DML操作)发生时,才会被MySQL自动调用。

2、优点

触发器可以用来对表实施复杂的完整性约束,保持数据的一致性,当触发器所保护的数据发生改变时,触发器会自动被激活,响应同时执行一定的操作(对其它相关表的操作),从而保证对数据的不完整性约束或不正确的修改。

3、缺点

①:数据维护困难:应用程序的业务逻辑处理与数据操作耦合度高,不利于扩展与维护。

②:可能产生死锁:若触发器中使用了锁机制,可能造成死锁,影响数据库的稳定性。

六、视图

1、概念

视图是一种虚拟的表,具有和物理表相同的功能。可以对视图进行增,改,查,操作,试图通常是有一个表或者多个表的行或列的子集。对视图的修改不影响基本表。它使得我们获取数据更容易,相比多表查询。

2、使用场景

①:代替复杂查询,减少复杂性;

②:提供一致性接口,实现业务的规则;

③:控制对于表的访问,提高安全性。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/710327.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

android工程师面试题目,安卓开发面试宝典

一、前言 不知不觉自己已经做了几年开发了,由记得刚出来工作的时候感觉自己能牛逼,现在回想起来感觉好无知。懂的越多的时候你才会发现懂的越少。 如果你的知识是一个圆,当你的圆越大时,圆外面的世界也就越大。 最近看到很多An…

Delegate动画案例(P30 5.6delegate动画)

一、ListElement,ListModel,ListView 1. ListElement ListElement 是 QML 中用于定义列表项的元素。它可以包含多个属性,每个属性对应列表项中的一个数据字段。通过在 ListModel 中使用 ListElement,可以定义一个列表的数据模型…

【leetcode】链表分割

大家好,我是苏貝,本篇博客带大家刷题,如果你觉得我写的还不错的话,可以给我一个赞👍吗,感谢❤️ 目录 方法1. 不用哨兵位方法2. 用哨兵位 点击查看题目 思路: 将链表分为2个链表list1和list2,…

物联网边缘计算云边协同

文章目录 一、物联网云边协同1.IoT云边协同设计2.物联网平台设计3.物联网平台实现 二、部署环境1.节点配置2.版本信息 三、IoT云边协同部署1.部署Kubernetes集群2.部署KubeEdge3.部署ThingsBoard集群4.部署Node-RED边缘网关4.1.边缘网关功能4.2.部署EMQX4.2.部署Node-RED 5.配置…

(正规api接口代发布权限)短视频账号矩阵系统实现开发--技术全自动化saas营销链路生态

短视频账号矩阵系统实现开发--技术全自动化saas营销链路生态源头开发(本篇禁止抄袭复刻) 一、短视频矩阵系统开发者架构 云罗短视频矩阵系统saas化系统,开发层将在CAP原则基础上使用分布式架构,对此网站的整体架构采用了基于B/S三层架构模式…

Django Web架构:全面掌握Django模型字段(下)

Django Web架构 全面掌握Django模型字段(下) - 文章信息 - Author: 李俊才 (jcLee95) Visit me at CSDN: https://jclee95.blog.csdn.netMy WebSite:http://thispage.tech/Email: 291148484163.com. Shenzhen ChinaAddress of this article…

协议和序列化反序列化

“协议”和序列化反序列化 “协议”的概念: “协议”本身是一种约定俗成的东西,由通讯双方必须共同遵从的一组约定,因此我们一定要将这种约定用计算机语言表达出来,此时双方计算机才能识别约定的相关内容 我们把这个规矩叫做“…

机器学习|决策树

左图的点是一种线性不可分的情况,无法拿一条直线去将进行分开。 每一个节点都代表一个决策,从而导致节点的分流。 最终的目标肯定是要达到分类。 但取得目标的过程是有所谓的好坏。 而这个好坏用熵/信息增益来衡量。 熵是一种用于反映系统混乱程度的物理…

思科网络设备监控

思科是 IT 行业的先驱之一,提供从交换机到刀片服务器的各种设备,以满足中小企业和企业的各种 IT 管理需求。管理充满思科的 IT 车间涉及许多管理挑战,例如监控可用性和性能、管理配置更改、存档防火墙日志、排除带宽问题等等,这需…

Makefile从入门到项目编译实战(学习笔记)

1.make和makefile介绍 1. make make 是一个应用程序,位于 /usr/bin/make 目录下,make 有如下的功能: (1)解析源程序之间的依赖关系 (2)根据依赖关系自动维护编译工作 (3&#xff09…

Jmeter插件PerfMon Metrics Collector安装使用及报错解决

Jmeter作为一个轻量级的性能测试工具,开源、小巧、灵活的特性使其越来越受到测试人员喜爱。在实际的项目中,特别是跨地区项目,排除合作方指定要求使用Loadrunner作为性能测试工具外,Jmeter会是首选。 本篇文章,就着重…

【MATLAB源码-第149期】基于MATLAB的2ASK,2FSK,2PSK,2DPSK等相干解调仿真,输出各节点波形。

操作环境: MATLAB 2022a 1、算法描述 2ASK(二进制幅移键控)、2FSK(二进制频移键控)、2PSK(二进制相移键控)和2DPSK(二进制差分相移键控)是数字调制技术中的基本调制方…

汽车三元催化器的废品项目详解,三元催化再生项目的回收技术教学

一、教程描述 这是一个收废品项目,就收那些别人不懂的,三元催化器的附加值高,只要掌握技术,怎么玩都行的,只是要放得下你的面子。三元催化器,是安装在汽车排气系统中最重要的机外净化装置,它可…

MATLAB环境基于全局和局部多特征融合的红外图像分割主动轮廓模型

红外图像是一种热图像,不受光照影响,在光照条件差、有烟雾遮挡的环境中,可以辅助或代替可见光成像在各个领域中应用,同时作为热成像,对景物的热辐射敏感,在安全监测、质量检验等领域具有优势。在以下几个方…

CSS的弹性布局

CSS 的弹性布局 前言 前端中为了实现页面的布局效果,采用的一个技术手段,它在前端开发的技术场景是非常广泛的 实现上述区域的页面相关的布局效果,就可以使用弹性布局来完成 弹性布局(flex布局) flex 是 flexible box 的缩写,…

文生视频基础1:sora技术报告学习

sora技术报告学习 背景学后理解训练流程技术拆解编码解码扩散模型训练用数据 28号直播交流会后的一些想法自身的一点点想法 参考 原文地址:Video generation models as world simulators 背景 此项目的背景是基于Datawhale的关于sora技术文档的拆解和相关技术讲解…

GEE入门篇|图像处理(二):在Earth Engine中进行波段计算

目录 波段计算 1.NDVI的计算 2.NDVI 归一化差值的单次运算计算 3.使用 NDWI 的归一化差值 波段计算 许多指数可以使用 Earth Engine 中的波段运算来计算。 波段运算是对图像中两个或多个波段进行加、减、乘或除的过程。 在这里,我们将首先手动执行此操作&#x…

Redis第6讲——主从复制模式详解

Redis的读写性能很高,但在面对大规模数据和高发访问的挑战时,单节点的Redis可能无法满足需求,这就引出了Redis集群的概念。本节先介绍一下Redis高可用方案之一的主从复制模式,虽说现在基本不会用这种模式,但是无论是哨…

特征值和特征向量及其在机器学习中的应用

特征值和特征向量是线性代数中的概念,用于分析和理解线性变换,特别是由方阵表示的线性变换。它们被用于许多不同的数学领域,包括机器学习和人工智能。 在机器学习中,特征值和特征向量用于表示数据、对数据执行操作以及训练机器学…

使用分布式锁解决分布式环境下的并发安全问题

分布式锁 分布式锁的基本概念 在我们进行单机应用开发,涉及并发同步的时候,我们往往采用synchronized或者Lock的方式来解决多线程间的代码同步问题,这时多线程的运行都是在同一个JVM之下。但当我们的应用是分布式集群工作的情况下&#xff…