DBA面试题-1

面临失业,整理一下面试题,找下家继续搬砖

主要参考:https://www.csdn.net/?spm=1001.2101.3001.4476

略有修改

一、mysql有哪些数据类型


1, 整形


tinyint,smallint,medumint,int,bigint;分别占用1字节、2字节、3字节、4字节、8字节
都可以带unsigned无符号
都可以带(x)来限制显示宽度
还有float,double,decimal的小数类型


2, 字符串


varchar,char,text blob
    1, char和varchar()指的是字符,不是字节;即char(10)可以存10个英文字母或者1汉字
    2, char()和varchar() utf8存一个汉字占3个字节,英文字母占1个字节;Length()查看字节长度,char_length()查看字符长度;
    3, char定长,尾部空格填充,性能好;varchar()变长,开头用1-2字节填充,结尾1个字节表结束
    4, char对英文字符占1个字节,汉语占2个字节;varchar每个字符2个字节
    5,  char 0-255,varchar 65535字节长度, 存汉字要除以3
    6,  text又分text,mediumtext,longtext-4G
    7,  blob存储二进制文件
    8, 推荐varchar()
    9, char和varchar支持默认值,text不支持
    
    

3, 时间


datetime, date,timestamp
推荐timestamp


二, 三范式


概念


是设计关系型数据库的规范,旨在减少冗余、提高一致性和简化维护
1NF:要求每一列都是原子的,例如联系方式中如果同时包含电话、邮箱、微信等久不符合
2NF:要求每个非主属性完全依赖于主键,而不能仅仅依赖主键一部分;例如客户表的数据要依赖于客户ID,不能依赖于客户姓名;
3NF:每个非主属性都是直接依赖主键,而不是间接依赖。 例如订单明细表中,产品名称和价格依赖于产品ID,产品ID依赖于订单ID;这样构成了传递依赖,这样可以将产品信息单独放入产品表中;


三范式优缺点

范式: 
优点:减少冗余、表更新快,存储空间少;
缺点:查询的时候要关联多个表,难以优化;
反范式
优点:通过冗余数据提高查询性能,减少关联,可以更好优化索引。
缺点:存在大量冗余数据,维护成本更高。 

实际工作中将范式和反范式结合用,对于请求量特别高的数据可以适当反范式;

三、索引

定义


索引(Index)是一种用于提高数据库查询效率的数据结构。它类似于书籍的目录,能够帮助快速定位并检索表中的数据行。
通过索引,数据库系统可以不必扫描整个表来查找所需的数据,而是直接访问索引结构,从而显著提高查询速度。


分类


物理分类:
聚簇索引:表中索引的键值顺序和数据行的存储顺序一致;
非聚簇索引:逻辑顺序和数据行的物理顺序不一致;

应用分类:主键索引、唯一索引、普通索引、组合索引
唯一索引可以为空,且可以多个空值;
主键索引不为空;


索引优点


    唯一索引可以保证唯一性
    索引恶意极大加快检索效率
    加速排序和分组操作
    可以加速表之间的连接效率
索引缺点:
    创建和维护索引需要花费时间,而且随着数据量的增加而增加;
    索引会占用物理机空间
    增加写操作开销,插入、更新、删除都需要对索引进行维护,这会增加操作开销,特别是大量写入时
    可能降低查询性能:如果索引选择不当,会导致查询性能下降
    


索引设计原则


    优先选择唯一性索引,速度快;
    经常作为查询条件的字段选择索引;
    限制索引数量
    尽量使用少的做索引
    清理不用的索引


索引的数据结构


    B+树和HASH索引
    Innodb使用的是B+树索引;
    Innodb内部实现了一个自适应hash功能:当用户执行大量查询操作,且很多查询都是访问相同的页面或者寻路模式,
    那么Innodb可能会在内存缓冲器中创建一个自适应hash索引,加速这些频繁的查询操作。

四、B+树结构


MySQL使用B+树作为其索引的数据结构,B+数是平衡多路搜索树,有如下特点
1, 数据存储位置: 存储在叶子节点,非叶子节点只存储索引;
2, 叶子节点连接方式:所有叶子节点通过指针相连,形成有序链表,便于顺序访问和范围查询;
3, 树高度:B+树的内部节点可以存储更多键值,因此比B-树具备更少的高度,所以在B+树中查找、删除、插入需要更少的IO
4, 查询效率:由于叶子节点间形成有序链表, 顺序访问和范围查询效率高; 效率:O(log n)
5, 插入和删除:由于数据只存储在叶子节点,所以操作只影响叶子节点和父节点,插入和删除快;


为什么MySQL用B+树不用B树


1,IO优化:B+树的非叶子节点只存储键值信息,不存储数据,所以每个节点能够存储更多的键值信息,从而查询同一层时,能够一次性读取更多数据块。减少磁盘IO操作;
            B树每个节点同时存储键值和数据,增加了节点大小,进而增加IO
            
2, 查询效率:B+树叶子节点间形成有序链表,范围和顺序查询快;
            由于B+树非叶子节点只存储键值信息,每个节点可以容纳更多键,从而降低树高度,树的高度减少意味着查找路径变短,查找效率提高
3, 动态维护:
    自平衡性:B+树能够在数据发生变化时自动调整,保持树平衡。确保了查询的效率和稳定性。
    插入和删除:B+树在某些情况下对插入和删除更高效,B+树可能只需要修改少量指针,而不用分裂合并

五、最左匹配原则


定义:使用联合索引时,查询条件必须从最左侧开始匹配,并且连续地使用索引。        
注意:    如果查询条件中包含范围查询(>,<,between,like前缀),MySQL会停止匹配。

最左匹配原理:因为组合索引是一个B+树,例如(a,b),它会按照最左字段构建。当a相等的时候,b是有序的,但是这个有序是相对的; 所以遇上范围查询的时候就会停止继续匹配;
    例如a=1 and b=2都可以命中,而a>1 and b=2无法命中

六、覆盖索引


覆盖索引(Covering Index)是一种特殊类型的索引,它不仅包含查询条件中的列,还包含要返回的列。换句话说,覆盖索引是一个包含查询所需所有列的索引,因此数据库只需查找索引,而不需要访问数据行(表),从而提高查询性能


七、什么是索引下推?

介绍
索引下推(Index condition pushdown) 简称 ICP,主要用于提升使用索引的查询效率。
在MySQL中,查询优化器会决定使用哪些索引来加速查询。当使用索引进行范围扫描时,传统的做法是先通过索引找到所有满足条件的索引项,然后回表(即访问实际的表数据)来获取完整的行数据,再在服务器层对这些行进行过滤,以确保它们满足WHERE子句中的其他条件。

索引下推技术则改变了这一流程:它将一部分过滤条件“下推”到存储引擎层,让存储引擎在扫描索引时就进行部分条件的过滤。这意味着存储引擎只返回那些真正满足所有条件的行数据给服务器层,从而减少服务器层需要处理的数据量。


索引下推的优势
1,减少数据访问,由于存储引擎在扫描时就进行了部分过滤,因此它只返回满足所有条件的行数据,减少了服务器层需要处理的数据量。
2,提高查询效率,通过减少不必要的数据访问和传输,索引下推可以显著提升性能。
3,降低IO开销:由于减少了存储引擎到服务器层的传输,从而降低了IO开销;


使用场景
索引下推通常用于带有范围扫描和复合条件的查询。例如,假设有一个表users,包含字段age和status,并且在这两个字段上建立了一个复合索引(age, status)。如果执行以下查询:

SELECT * FROM users WHERE age BETWEEN 20 AND 30 AND status = 'active';


在没有索引下推的情况下,MySQL会先通过索引找到age在20到30之间的所有行,然后回表获取这些行的完整数据,并在服务器层过滤出status = 'active'的行。

而在使用索引下推的情况下,MySQL会将status = 'active'这一条件“下推”到存储引擎层,让存储引擎在扫描索引时就进行过滤,只返回满足age BETWEEN 20 AND 30且status = 'active'的行数据给服务器层。

验证ICP是否生效?
可以使用EXPLAIN语句。在EXPLAIN的输出中,如果Extra列包含Using index condition,则表示该查询使用了索引下推优化。

八、存储


InnoDB 的四大特性?


支持事务
行级锁
外检约束
崩溃恢复


InnoDB 为何推荐使用自增主键?


1, 提高插入性能:自增主键可以保证每次插入时B+索引是从右边扩展的,可以避免B+树频繁合并和分裂。如果使用字符串主键和随机主键,会使得数据随机插入,效率比较差。
2, 减少页分裂和碎片:Innodb中,数据以页为单位进行存储。如果主键非自增,新数据插入可能导致页分裂,即原有的页无法容纳新数据需要将数据拆分到2个页中。这会增加额外的IO开销和CPU资源;
    而使用自增主键的时候,数据通常都可以顺序追加到页中,减少了分页频率,提高存储效率,减少了数据碎片。由于数据按顺序追加,所以空间利用率高,减少了空间浪费。
3, 预测和缓存:使用自增主键,由于主键值是顺序递增,系统可以很容易预测下一个主键值,这种可预测性使得数据库可以更有效地利用缓存和预测机制,提前加载和缓存即将访问的数据,提高查询性能。
4, 二次索引优势:当使用自增主键时,由于聚簇索引是有序的,非聚簇索引的查询效率也会得到提升


如何选择引擎:
建议统一用Innodb


什么是Innodb的页区段?

介绍

页(page):是存储的最小单位,每一页默认 16k,是数据实际存储的页;
区(extent):逻辑概念,因为页非常多,不利于回收和管理,引入区(extent)的概念来便于资源的分配和回收,是innodb分配和回收资源的单位,每个区是连续地64 pages,即1MB;
段(segment):逻辑概念,段由一个或多个区组成,可以不连续。段是数据库的分配单位,不同类型的数据对象以不同的段形式存在。有数据段(叶子节点),索引段(非叶子节点),回滚段。

页有哪些信息组成

File Header: 文件头,描述数据页的外部信息,属于哪个表空间,前后页的页号。

Page Header: 页头,描述页的信息,有多少条记录,第一条记录的位置

infimum和superemum:系统生成的记录,分别是最小记录值和最大记录值。

User Records: 表中对应的数据,一般用Compact格式

除了表中插入的数据外还有一些隐藏列,另外还有transaction_id(事务ID), roll_pointer(回滚指针)

roll_id :有主键则指定主键,没有则用唯一索引,也没有则系统自动生成row_id;为隐藏列

Free Page:页中的空闲存储,可以插入记录。

Page Directory:类似字典的目录结构,根据主键大小每隔4-8个记录设置一个槽,用来记录其位置,当根据主键查找位置时,首先找到数据所在的槽,然后在槽中线性搜索。这种方法比遍历页要快。

Page Tailer:File Header存储刷盘前内存的校验和,Page Tailer储存刷盘后的校验和。当刷盘的时候,出现异常,Page Tailer和File Header中的校验和不一致,则说明出现刷盘错误。

页中插入记录的过程

1,如果Free Space空间足够的话,则直接分配空间来添加记录,并将插入前最后一条记录的next-record指向当前的插入记录,将当前记录的next-record指向supremum记录

2, 如果Free Space空间不够的话,将之前删除造成的碎片重新整理后,按照上述步骤重新插入

3, 如果当前页碎片整理后还不够的话,则重新申请页,将页初始化后按照上述步骤重新插入

什么是Buffer Pool

Buffer Pool是Innodb引擎层的缓冲池,不属于MySQL的Server层

内存中以页(page)为单位缓存磁盘数据,减少磁盘IO,提升访问速度。缓冲池大小默认 128M,独立的 MySQL 服务器推荐设置缓冲池大小为总内存的 80%。主要存储数据页、索引页更新缓冲(change buffer)等。

预读机制

Buffer Pool有一项技能交预读机制,存储引擎在被Server层调用时,会在响应的同时进行预判,将下次可能用到的数据和索引加载到Buffer Pool中。

预读策略分为线性预读(innodb_read_ahead_threshold)和随机预读,Innodb用线性,随机已基本废弃

线性预读:如果前面的请求顺序地访问当前区(extend)的页,那么接下来的请求也会顺序地访问下一个区的页,并将下一个区加载到BufferPool中

换页算法

Innodb的淘汰策略(换页算法)和传统的LRU(最少使用算法)不同,面临如下2个问题

1,预读失败:由于提前将数据放入BufferPool,但是MySQL最终没有从页中读取

要解决预读失败问题,则让预读失败的数据停留缓冲池时间尽可能短,预读成功的页停留尽可能长。具体将LRU链分代实现,即新生代和老年代。预读页假如缓冲池时只假如老年代的头部,只有真正预读成功了再转到新生代。如果预读失败则最先被清理。

2,缓冲池污染:如果批量扫描大量数据的时候,可能导致缓冲池所有页都被替换,导致大量热数据被换出,MySQL性能急剧下降

InnoDB Buffer Pool加入了一个老生带停留时间窗口机制,只有预读成功,并且在老年代提留时间超过该窗口时间的数据才会被放入新生代头部。

什么是Change Buffer?

如果每次写操作都更新磁盘数据,会占满IO,导致性能慢。为了减少IO,InnoDB在BufferPool中开辟了一块内存,用来存储变更记录,为了防止异常宕机丢失数据,当事务提交时会将变更记录持久化到磁盘(redo log)。等待时机更新磁盘的数据文件(刷脏),用来缓存写操作的内存就是Change Buffer。

Change Buffer默认占Buffer Pool的25%,最大50%

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/63052.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【Rust WebAssembly 入门实操遇到的问题】

Rust WebAssembly 入门实操遇到的问题 什么是WebAssembly跟着教程走wasm-pack build error总结 什么是WebAssembly WebAssembly&#xff08;简称Wasm&#xff09;是一种基于堆栈的虚拟机的二进制指令 格式。Wasm 被设计为编程语言的可移植编译目标&#xff0c;支持在 Web 上部…

数据挖掘之数据预处理

​​​​​​​ 引言 数据挖掘是从大量数据中提取有用信息和知识的过程。在这个过程中&#xff0c;数据预处理是不可或缺的关键步骤。数据预处理旨在清理和转换数据&#xff0c;以提高数据质量&#xff0c;从而为后续的数据挖掘任务奠定坚实的基础。由于现实世界中的数据通常…

21个Python脚本自动执行日常任务(1)

引言 作为编程领域摸爬滚打超过十年的老手&#xff0c;我深刻体会到&#xff0c;自动化那些重复性工作能大大节省我们的时间和精力。 Python以其简洁的语法和功能强大的库支持&#xff0c;成为了编写自动化脚本的首选语言。无论你是专业的程序员&#xff0c;还是希望简化日常工…

从 HTML 到 CSS:开启网页样式之旅(五)—— CSS盒子模型

从 HTML 到 CSS&#xff1a;开启网页样式之旅&#xff08;五&#xff09;—— CSS盒子模型 前言一、盒子模型的组成margin&#xff08;外边距&#xff09;&#xff1a;border&#xff08;边框&#xff09;&#xff1a;padding&#xff08;内边距&#xff09;&#xff1a;conten…

使用Feign远程调用丢失请求头问题

在使用Feign进行远程调用时&#xff0c;当前服务是能拿到请求头信息的&#xff0c;请求头包含有登录认证Cookie等重要信息&#xff0c;但是在调用远程服务时&#xff0c;远程服务却拿不到请求头信息&#xff0c;因为使用Feign进行远程调用实际上是发起新的Request请求了&#x…

2021数学分析【南昌大学】

2021 数学分析 求极限 lim ⁡ n → ∞ 1 n ( n + 1 ) ( n + 2 ) ⋯ ( n + n ) n \lim_{n \to \infty} \frac{1}{n} \sqrt [n]{(n+1)(n+2) \cdots (n+n)} n→∞lim​n1​n(n+1)(n+2)⋯(n+n) ​ lim ⁡ n → ∞ 1 n ( n + 1 ) ( n + 2 ) ⋯ ( n + n ) n = lim ⁡ n → ∞ ( n + …

vue+mars3d点击图层展示炫酷的popup弹窗

展示效果 目录 一&#xff1a;叠加数据图层到地图上&#xff0c;此时需要使用bindPopup绑定popup 二、封装自定义的popup&#xff0c;样式可以自行调整 一&#xff1a;叠加数据图层到地图上&#xff0c;此时需要使用bindPopup绑定popup 这里我根据数据不同&#xff0c;展示的…

【AIGC】如何使用高价值提示词Prompt提升ChatGPT响应质量

博客主页&#xff1a; [小ᶻ☡꙳ᵃⁱᵍᶜ꙳] 本文专栏: AIGC | 提示词Prompt应用实例 文章目录 &#x1f4af;前言&#x1f4af;提示词英文模板&#x1f4af;提示词中文解析1. 明确需求2. 建议额外角色3. 角色确认与修改4. 逐步完善提示5. 确定参考资料6. 生成和优化提示7.…

FPGA存在的意义:为什么adc连续采样需要fpga来做,而不会直接用iic来实现

FPGA存在的意义&#xff1a;为什么adc连续采样需要fpga来做&#xff0c;而不会直接用iic来实现 原因ADS111x连续采样实现连续采样功能说明iic读取adc的数据速率 VS adc连续采样的速率adc连续采样的速率iic读取adc的数据速率结论分析 FPGA读取adc数据问题一&#xff1a;读取adc数…

LobeChat-46.6k星!顶级AI工具集,一键部署,界面美观易用,ApiSmart 是你肉身体验学习LLM 最好IDEA 工具

LobeChat LobeChat的开源&#xff0c;把AI功能集合到一起&#xff0c;真的太爽了。 我第一次发现LobeChat的时候&#xff0c;就是看到那炫酷的页面&#xff0c;这么强的前端真的是在秀肌肉啊&#xff01; 看下它的官网&#xff0c;整个网站的动效简直闪瞎我&#xff01; GitH…

[报错] Error: PostCSS plugin autoprefixer requires PostCSS 8 问题解决办法

报错&#xff1a;Error: PostCSS plugin autoprefixer requires PostCSS 8 原因&#xff1a;autoprefixer版本过高 解决方案&#xff1a; 降低autoprefixer版本 执行&#xff1a;npm i postcss-loader autoprefixer8.0.0 参考&#xff1a; Error: PostCSS plugin autoprefix…

基于STM32的Wi-Fi无人机项目

引言 随着无人机技术的快速发展&#xff0c;基于微控制器的DIY无人机变得越来越流行。本项目将介绍如何使用STM32微控制器制作一架简单的Wi-Fi无人机。通过本项目&#xff0c;您将了解到无人机的基本组成部分&#xff0c;如何进行硬件连接&#xff0c;代码编写&#xff0c;以及…

IDEA注释格式、匹配补全调整

1.注释格式调整 目前重新捡起一部分Java&#xff0c;写代码时候发现注释快捷键总是放在第一列&#xff0c;看起来很难受&#xff0c;故寻找方法如下&#xff1a; 分别点击 编辑器-代码样式-Java 修改注释代码选项如下 2.大小写匹配补全问题 还发现在写代码过程中&#xff0c…

麒麟 V10(ky10.x86_64)无网环境下 openssl - 3.2.2 与 openssh - 9.8p1 升级【最全教程】

目录 背景 安装包下载 上传解压安装包 安装zlib 安装OpenSSL 安装OpenSSH 验证 背景 近期&#xff0c;项目上线已进入倒计时阶段&#xff0c;然而在至关重要的安全检查环节中&#xff0c;却惊现现有的 OpenSSH 存在一系列令人担忧的漏洞&#xff1a; OpenSSH 资源管理错…

高级架构二 Git基础到高级

一 Git仓库的基本概念和流程 什么是版本库&#xff1f;版本库又名仓库&#xff0c;英文名repository,你可以简单的理解一个目录&#xff0c;这个目录里面的所有文件都可以被Git管理起来&#xff0c;每个文件的修改&#xff0c;删除&#xff0c;Git都能跟踪&#xff0c;以便任何…

从excel数据导入到sqlsever遇到的问题

1、格式问题时间格式&#xff0c;excel中将日期列改为日期未生效&#xff0c;改完后&#xff0c;必须手动单击这个单元格才能生效&#xff0c;那不可能一个一个去双击。解决方案如下 2、导入之后表字段格式问题&#xff0c;数据类型的用navicat导入之后默认是nvarchar类型的&a…

FREERTOS二值信号量实验

代码&#xff1a; 主程序 #include "./SYSTEM/sys/sys.h" #include "./SYSTEM/usart/usart.h" #include "./SYSTEM/delay/delay.h" #include "./BSP/LED/led.h" #include "./BSP/LCD/lcd.h" #include "./BSP/KEY/key…

对于Oracle来说,土地管理是非核心域吗

思雨喵 2022-1-4 14:13 您在课上说&#xff0c;对于土地管理系统来说oracle&#xff0c;arcgis&#xff0c;java是非核心域&#xff0c;因为它们可有可无。我想请教对于oracle来说&#xff0c;土地管理好像也是可有可无&#xff0c;那么土地管理是非核心域吗 UMLChina潘加宇 …

工业齐套管理虚拟现实仿真模拟软件

工业齐套管理虚拟现实仿真模拟软件是与法国最大的汽车制造商合作开发的一款虚拟现实仿真模拟软件&#xff0c;借助身临其境的虚拟现实环境&#xff0c;无需停止生产线&#xff0c;即可模拟仓库和提货区域。 工业齐套管理虚拟现实仿真模拟软件不仅适用于汽车工业&#xff0c;安全…

状态模式的理解和实践

在软件开发中&#xff0c;我们经常遇到需要根据对象的不同状态执行不同行为的情况。如果直接将这些状态判断和行为逻辑写在同一个类中&#xff0c;会导致该类变得臃肿且难以维护。为了解决这个问题&#xff0c;状态模式&#xff08;State Pattern&#xff09;应运而生。状态模式…