PostgreSQL缓存管理

缓冲区管理器、存储和后端进程之间的关系

在这里插入图片描述

缓存管理结构

PostgreSQL 缓冲区管理器由buffer table、buffer descriptors和buffer pool组成。buffer pool层存储表和索引等数据文件页,以及空闲空间映射和可见性映射。buffer pool是一个数组,每个槽存储数据文件的一个页面。缓冲池数组的索引称为 buffer_ids。
在这里插入图片描述

  • Buffer pool:存储数据文件页面的数组。数组中的每个槽称为缓冲区_ids。
  • Buffer descriptors:缓冲区描述符数组。每个描述符与一个缓冲池插槽一一对应,并保存相应插槽中存储页面的元数据。
  • Buffer table:哈希表,用于存储已存储页面的缓冲区标签(buffer_tags)与保存已存储页面各自元数据的描述符缓冲区标识(buffer_ids)之间的关系。

Buffer table

缓冲表在逻辑上可分为三个部分:hash function、hash bucket slots和data entries

内置hash function将buffer_tags映射到hash bucket slots。尽管hash bucket的数量多于bucket slots的数量,但仍可能发生碰撞。因此,缓冲区表使用单独的链表方法来解决碰撞问题。当数据条目被映射到同一个缓冲区槽时,这种方法会将条目存储在同一个链表中。

在这里插入图片描述
data entries由两个值组成:页面的缓冲区标签(buffer_tag)和保存页面元数据的描述符的缓冲区 ID

Buffer_tag

/** Buffer tag identifies which disk block the buffer contains.** Note: the BufferTag data must be sufficient to determine where to write the* block, without reference to pg_class or pg_tablespace entries.  It's* possible that the backend flushing the buffer doesn't even believe the* relation is visible yet (its xact may have started before the xact that* created the rel).  The storage manager must be able to cope anyway.** Note: if there's any pad bytes in the struct, InitBufferTag will have* to be fixed to zero them, since this struct is used as a hash key.*/
typedef struct buftag
{Oid			spcOid;			/* tablespace oid */Oid			dbOid;			/* database oid */RelFileNumber relNumber;	/* relation file number */ForkNumber	forkNum;		/* fork number */BlockNumber blockNum;		/* blknum relative to begin of reln */
} BufferTag;

在 PostgreSQL 中,所有数据文件的每个页面都可以分配一个唯一的标签,即缓冲区标签。当缓冲区管理器收到请求时,PostgreSQL 会使用所需页面的缓冲区标签。

  • specOid: 包含目标页面的关系所属表空间的 OID。
  • dbOid: 包含目标页面的关系所属数据库的 OID。
  • relNumber: 包含目标页面的关系文件的编号。
  • blockNum: 目标页面在关系中的块编号。
  • forkNum:分叉编号: 页面所属关系的 fork 编号。表、自由空间映射和可见性映射的叉号分别定义为 0、1 和 2。

Buffer Descriptor

/** Flags for buffer descriptors** Note: BM_TAG_VALID essentially means that there is a buffer hashtable* entry associated with the buffer's tag.*/
#define BM_LOCKED		(1U << 22)	/* buffer header is locked */
#define BM_DIRTY		(1U << 23)	/* data needs writing */
#define BM_VALID		(1U << 24)	/* data is valid */
#define BM_TAG_VALID		(1U << 25)	/* tag is assigned */
#define BM_IO_IN_PROGRESS	(1U << 26)	/* read or write in progress */
#define BM_IO_ERROR		(1U << 27)	/* previous I/O failed */
#define BM_JUST_DIRTIED		(1U << 28)	/* dirtied since write started */
#define BM_PIN_COUNT_WAITER	(1U << 29)	/* have waiter for sole pin */
#define BM_CHECKPOINT_NEEDED	(1U << 30)	/* must write for checkpoint */
#define BM_PERMANENT		(1U << 31)	/* permanent buffer (not unlogged,* or init fork) */#define PG_HAVE_ATOMIC_U32_SUPPORT
typedef struct pg_atomic_uint32
{volatile uint32 value;
} pg_atomic_uint32;typedef struct BufferDesc
{BufferTag	tag;			/* ID of page contained in buffer */int		buf_id;			/* buffer's index number (from 0) *//* state of the tag, containing flags, refcount and usagecount */pg_atomic_uint32 state;int		wait_backend_pgprocno;	/* backend of pin-count waiter */int		freeNext;		/* link in freelist chain */LWLock		content_lock;	/* to lock access to buffer contents */
} BufferDesc;
  • tag :是相应缓冲池插槽中存储页面的缓冲区标签。
  • buf_id :标识描述符。
  • content_lock :是一个轻量级锁,用于控制对相关存储页面的访问。
  • freeNext :是指向生成自由列表的下一个描述符的指针。
  • states :可以保存相关存储页面的多个状态和变量,如 refcount 和 usage_count。

descriptor states

  • Empty:当相应的缓冲池槽没有存储页面时(即 refcount 和 usage_count 为 0),该描述符的状态为空。
  • Pinned:当相应的缓冲池槽存储了一个页面,且有任何 PostgreSQL 进程正在访问该页面(即 refcount 和 usage_count 大于或等于 1)时,该缓冲区描述符的状态就会被钉住。
  • Unpinned:当相应的缓冲池插槽存储了一个页面,但没有 PostgreSQL 进程访问该页面(即 usage_count 大于或等于 1,但 refcount 为 0)时,该缓冲区描述符的状态为Unpinned。

Buffer Descriptors Layer

Buffer Descriptors集合构成一个数组,在本文档中称为Buffer Descriptors Layer。

服务器启动时,所有缓冲区描述符的状态都是空的。在 PostgreSQL 中,这些描述符由一个称为 freelist 的链表组成
在这里插入图片描述
加载第一页步骤:
(1) 从自由列表顶端读取一个空描述符,并将其固定(即将其 refcount 和 usage_count 增加 1)。
(2) 在缓冲区表中插入一个新条目,将第一页的标签映射到检索到的描述符的缓冲区 ID。
(3) 将新页面从存储器加载到相应的缓冲池插槽中。
(4) 将新页面的元数据保存到检索到的描述符中。

在这里插入图片描述
从freelist中获取的描述符始终保留页面的元数据。换句话说,非空描述符一旦被使用,就不会返回freelist。但是,当出现以下情况之一时,相应的描述符会被再次添加到自由列表中,描述符状态也会被设置为 “NULL”:

  1. 表或索引被删除。
  2. 数据库被删除。
  3. 使用 VACUUM FULL 命令清理表或索引。

buffer pool

缓冲池是一个简单数组,用于存储表和索引等数据文件页。缓冲池数组的索引称为 buffer_ids。

缓冲池槽的大小为 8 KB,相当于一个页面的大小。因此,每个槽可以存储整个页面。

Buffer Manager Works

Accessing a Page Stored in the Buffer Pool

  1. 创建所需页面的缓冲区标签,并使用哈希函数计算包含已创建缓冲区标签相关条目的哈希桶槽。
  2. 以共享模式获取覆盖所获哈希桶槽的 BufMappingLock 分区(该锁将在步骤 (5) 中释放)。
  3. 查找标签为 "Tag_C "的条目,并从条目中获取缓冲区 ID。在本例中,缓冲区 ID 为 2
  4. 将 buffer_id 2 的缓冲区描述符钉住,同时将该描述符的 refcount 和 usage_count 增加 1
  5. 释放 BufMappingLock。
  6. 访问缓冲区标识为 2 的缓冲区池插槽。

在这里插入图片描述
然后,当从缓冲池插槽中的页面读取行时,PostgreSQL 进程会获取相应缓冲区描述符的共享 content_lock。因此,缓冲池插槽可同时被多个进程读取。

当向页面插入(以及更新或删除)记录时,PostgreSQL 进程会获取相应缓冲区描述符的独占内容锁。(注意,页面的 dirty 位必须设置为 “1”)。

访问页面后,相应缓冲区描述符的 refcount 值将减少 1。

Loading a Page from Storage to Empty Slot

将页面从存储器加载到空槽
(1) 查找缓冲区表(假设未找到)。

  1. 创建所需页面的缓冲区标记(本例中缓冲区标记为 “Tag_E”)并计算哈希桶槽。
  2. 以共享模式获取 BufMappingLock 分区。
  3. 查找缓冲区表。(根据假设未找到)。
  4. 释放 BufMappingLock。

(2) 从 freelist 中获取空缓冲区描述符,并将其固定。在本例中,获取的描述符的 buffer_id 为 4。
(3) 以独占模式获取 BufMappingLock 分区。(该锁将在步骤 (6) 中释放)。
(4) 创建一个包含缓冲区标记 "Tag_E "和缓冲区 ID 4 的新数据条目。 将创建的条目插入缓冲区表。
(5) 将所需的页面数据从存储器加载到缓冲区池插槽中,缓冲区标识为 4,具体步骤如下:

  1. 在 9.5 或更早版本中,获取相应描述符的独占 io_in_progress_lock 2.
  2. 将相应描述符的 io_in_progress 位设置为 “1”,以防止其他进程访问。
  3. 将所需的页面数据从存储器加载到缓冲池插槽。
  4. 更改相应描述符的状态:将 io_in_progress 位设置为 “0”,将有效位设置为 “1”。
  5. 在 9.5 或更早版本中,释放 io_in_progress_lock 。

(6) 释放 BufMappingLock。
(7) 访问 buffer_id 为 4 的缓冲池插槽。

在这里插入图片描述

Loading a Page from Storage to a Victim Buffer Pool Slot

假设所有缓冲池插槽都被页面占用,但所需页面未被存储。缓冲区管理器执行以下步骤:
(1)创建所需页面的缓冲区标签,并查找缓冲区表。
(2)使用时钟扫描算法选择一个victim buffer pool slot。从缓冲区表中获取包含victim pool slot buffer_ID 的旧条目,并将victim buffer pool slot固定在缓冲区描述符层中。
(3)如果是脏数据,则清除(写入并同步)受害页数据;否则继续执行步骤 (4)。
在用新数据覆盖之前,必须先将脏页写入存储器。刷新脏页的步骤如下:

  • 获取具有 5 的描述符的共享context_lock和独占的 io_in_progress 锁(在步骤 6 中释放)。
  • 更改相应描述符的状态;将 io_in_progress 位设置为 “1”,将 just_dirtied 位设置为 “0”。
  • 根据情况调用 XLogFlush() 函数,将 WAL 缓冲区中的 WAL 数据写入当前的 WAL 段文件。
  • 将victim页面数据刷新到存储中。
  • 更改相应描述符的状态;将 io_in_progress 位设置为 “0”,将 valid 位设置为 “1”。
  • 释放 io_in_progress 和 content_lock 锁。

(4)以独占模式获取包含旧条目插槽的旧 BufMappingLock 分区。
(5)获取新的 BufMappingLock 分区,并在缓冲区表中插入新条目

  • 创建由新缓冲区标签 "Tag_M "和victim buffer_ID 组成的新条目。
  • 获取新的 BufMappingLock 分区,该分区以独占模式覆盖了包含新条目的插槽。
  • 将新条目插入缓冲区表。

(6) 从缓冲区表中删除旧条目,并释放旧的 BufMappingLock 分区。
(7) 将所需的页面数据从存储器加载到受害者缓冲区插槽。然后,更新带有 buffer_id 5 的描述符的标志;将 dirty 位设置为 0,并初始化其他位。
(8) 释放新的 BufMappingLock 分区。
(9) 访问带有 buffer_id 5 的缓冲池槽。

在这里插入图片描述
在这里插入图片描述

Page Replacement Algorithm: Clock Sweep

将缓冲区描述符想象成一个循环列表。nextVictimBuffer 是一个无符号 32 位整数,始终指向其中一个缓冲区描述符,并顺时针旋转。算法的伪代码和说明如下:

     WHILE true
(1)     Obtain the candidate buffer descriptor pointed by the nextVictimBuffer
(2)     IF the candidate descriptor is unpinned THEN
(3)	       IF the candidate descriptor's usage_count == 0 THENBREAK WHILE LOOP  /* the corresponding slot of this descriptor is victim slot. */ELSEDecrease the candidate descriptpor's usage_count by 1END IFEND IF
(4)     Advance nextVictimBuffer to the next oneEND WHILE 
(5) RETURN buffer_id of the victim

(1) 获取 nextVictimBuffer 指向的候选缓冲区描述符。
(2) 如果候选缓冲区描述符未锁定,则执行步骤 (3)。否则,进入步骤 (4)。
(3) 如果候选描述符的使用次数为 0,则选择该描述符的相应槽作为victim,并继续执行步骤 (5)。否则,将该描述符的使用次数减 1,并继续执行步骤 (4)。
(4) 将 nextVictimBuffer 提前到下一个描述符(如果在末尾,则绕一圈),然后返回步骤 (1)。重复上述步骤,直到找到victim。
(5) 返回victim的buffer_ID。

在这里插入图片描述

  • nextVictimBuffer 指向第一个描述符(buffer_id 1)。但是,由于该描述符已被钉住,因此会被跳过。
  • nextVictimBuffer 指向第二个描述符(buffer_id 2)。因此,使用次数减少 1,nextVictimBuffer 进入第三个候选对象。
  • nextVictimBuffer 指向第三个描述符(buffer_id 3)。因此,它是本轮的victim。

每当 nextVictimBuffer 扫描一个未固定的描述符时,其 usage_count 就会减少 1。 因此,如果缓冲池中存在未固定的描述符,该算法总能通过旋转 nextVictimBuffer 找到一个 usage_count 为 0 的受害者。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/81067.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

TensorFlow与pytorch特定版本虚拟环境的安装

TensorFlow与Python的版本对应&#xff0c;注意&#xff0c;一定要选择对应的版本&#xff0c;否则会让你非常痛苦&#xff0c;折腾很久搞不清楚原因。 建议使用国内镜像源安装 没有GPU后缀的就表示是CPU版本的&#xff0c;不加版本就是最新 pip install tensorflow -i https:…

150.逆波兰表达式求值

目录 一、题目 二、分析代码 三、中缀表达式转后缀表达式 一、题目 150. 逆波兰表达式求值 - 力扣&#xff08;LeetCode&#xff09; 二、分析代码 class Solution { public:int evalRPN(vector<string>& tokens) {stack<int>s;for(auto ch:tokens){if(ch!…

车载软件架构 —— AUTOSAR Vector SIP包(一)

车载软件架构 —— AUTOSAR Vector SIP包(一) 我是穿拖鞋的汉子,魔都中坚持长期主义的汽车电子工程师。 老规矩,分享一段喜欢的文字,避免自己成为高知识低文化的工程师: 没有人关注你。也无需有人关注你。你必须承认自己的价值,你不能站在他人的角度来反对自己。人生在…

进程程序替换

✅<1>主页&#xff1a;&#xff1a;我的代码爱吃辣 &#x1f4c3;<2>知识讲解&#xff1a;Linux——进程替换 ☂️<3>开发环境&#xff1a;Centos7 &#x1f4ac;<4>前言&#xff1a;我们创建子进程的目的是什么&#xff1f;想让子进程帮我们执行特定的…

Docker搭建ELK日志采集服务及Kibana可视化图表展示

架构 ES docker network create elkmkdir -p /opt/ELK/es/datachmod 777 /opt/ELK/esdocker run -d --name elasticsearch --net elk -p 9200:9200 -p 9300:9300 -e "discovery.typesingle-node" -v /opt/ELK/es/plugins:/usr/share/elasticsearch/plugins -v /opt/…

嵌入式C 语言中的三块技术难点

​ C 语言在嵌入式学习中是必备的知识&#xff0c;甚至大部分操作系统都要围绕 C 语言进行&#xff0c;而其中有三块技术难点&#xff0c;几乎是公认级别的“难啃的硬骨头”。 今天就来带你将这三块硬骨头细细拆解开来&#xff0c;一定让你看明白了。 0x01 指针 指针是公认…

redis实战-redis实现异步秒杀优化

秒杀优化-异步秒杀思路 未优化的思路 当用户发起请求&#xff0c;此时会请求nginx&#xff0c;nginx会访问到tomcat&#xff0c;而tomcat中的程序&#xff0c;会进行串行操作&#xff0c;分成如下几个步骤 1、查询优惠卷 2、判断秒杀库存是否足够 3、查询订单 4、校验是否是一…

MySQL——主从复制

简介 在实际的生产中&#xff0c;为了解决Mysql的单点故障已经提高MySQL的整体服务性能&#xff0c;一般都会采用「主从复制」。 主从复制开始前有个前提条件&#xff1a;两边的数据要一样&#xff0c;主必须开启二进制日志 dump thread 线程 基于位置点从是否需要开启二进…

计算机组成原理——基础入门总结(一)

本帖更新一些关于计算机组成原理的重点内容。由于博主考研时并不会考这门课&#xff0c;但是考虑到操作系统中又很多重要晦涩的概念涉及很多诸如内存、存储器、磁盘、cpu乃至各种寄存器的知识&#xff0c;此处挑选一些核心的内容总结复盘一遍——实现声明&#xff1a;本帖的内容…

Python统计pdf中英文单词的个数

之前的文章提供了批量识别pdf中英文的方法,详见【python爬虫】批量识别pdf中的英文,自动翻译成中文上。以及自动pdf英文转中文文档,详见【python爬虫】批量识别pdf中的英文,自动翻译成中文下。    本文实现python统计pdf中英文字符的个数。 文章目录 一、要统计字符的pdf…

第16篇ESP32 platformio_arduino框架 wifi联网_连接WiFi热点并连接tcp server收发数据进行通讯

第1篇:Arduino与ESP32开发板的安装方法 第2篇:ESP32 helloword第一个程序示范点亮板载LED 第3篇:vscode搭建esp32 arduino开发环境 第4篇:vscodeplatformio搭建esp32 arduino开发环境 ​​​​​​第5篇:doit_esp32_devkit_v1使用pmw呼吸灯实验 第6篇:ESP32连接无源喇叭播…

许可分析 license分析 第十一章

许可分析是指对软件许可证进行详细的分析和评估&#xff0c;以了解组织内部对软件许可的需求和使用情况。通过许可分析&#xff0c;可以帮助组织更好地管理和优化软件许可证的使用。以下是一些可能的许可分析方法和步骤&#xff1a; 软件许可证监管合规性&#xff1a;严格遵守软…

Linux 文件创建、查看

touch、cat、more命令 ①touch命令——创建文件 ②cat命令——查看文件内容全部显示 这是txt.txt文件内容 使用cat命令查看 ③more命令——查看文件内容支持翻页 在查看的过程中&#xff0c;通过空格翻页&#xff0c;通过q退出查看

C语言练习题解析(2)

&#x1f493;博客主页&#xff1a;江池俊的博客⏩收录专栏&#xff1a;C语言刷题专栏&#x1f449;专栏推荐&#xff1a;✅C语言初阶之路 ✅C语言进阶之路&#x1f4bb;代码仓库&#xff1a;江池俊的代码仓库&#x1f389;欢迎大家点赞&#x1f44d;评论&#x1f4dd;收藏⭐ 文…

蓝桥杯2023年第十四届省赛真题-更小的数--题解

目录 蓝桥杯2023年第十四届省赛真题-更小的数 题目描述 输入格式 输出格式 样例输入 样例输出 提示 【思路解析】 【代码实现】 蓝桥杯2023年第十四届省赛真题-更小的数 时间限制: 3s 内存限制: 320MB 提交: 895 解决: 303 题目描述 小蓝有一个长度均为 n 且仅由数字…

C2基础设施威胁情报对抗策略

威胁情报是指在信息安全和安全防御领域&#xff0c;收集、分析和解释与潜在威胁相关的信息&#xff0c;以便预先发现并评估可能对组织资产造成损害的潜在威胁&#xff0c;是一种多维度、综合性的方法&#xff0c;其通过信息的收集、分析和研判&#xff0c;帮助组织了解可能对其…

C++---继承

继承 前言继承的概念及定义继承的概念继承定义继承关系和访问限定符 基类和派生类对象赋值转换继承中的作用域派生类的默认成员函数继承与友元继承与静态成员**多重继承**多继承下的类作用域菱形继承虚继承使用虚基类 支持向基类的常规类型转换 前言 在需要写Father类和Mother…

征战开发板从无到有(三)

接上一篇&#xff0c;翘首已盼的PCB板子做好了&#xff0c;管脚约束信息都在PCB板上体现出来了&#xff0c;很满意&#xff0c;会不会成为爆款呢&#xff0c;嘿嘿&#xff0c;来&#xff0c;先看看PCB裸板美图 由于征战开发板电路功能兼容小梅哥ACX720&#xff0c;大家可以直…

【MySQL】 MySQL数据库基础

文章目录 &#x1f431;‍&#x1f453;数据库的操作&#x1f4cc;显示当前的数据库&#x1f4cc;创建数据库&#x1f388;语法&#xff1a;&#x1f388;语法说明&#x1f388;示例&#xff1a; &#x1f334;使用数据库&#x1f38b;删除数据库&#x1f431;‍&#x1f3cd;语…

Stable DIffusion 炫酷应用 | AI嵌入艺术字+光影光效

目录 1 生成AI艺术字基本流程 1.1 生成黑白图 1.2 启用ControlNet 参数设置 1.3 选择大模型 写提示词 2 不同效果组合 2.1 更改提示词 2.2 更改ControlNet 2.2.1 更改模型或者预处理器 2.2.2 更改参数 3. 其他应用 3.1 AI光影字 本节需要用到ControlNet&#xff0c;可…