PostgreSQL计算 queryid 原理

数据库版本

  • PG 16.1

queryid 是什么

queryid 是将 sql 规范化 (normalization) 后,通过哈希函数计算出来的 64 位整数。

SELECT id, data FROM tbl_a WHERE id < 300 ORDER BY data; 这条 SQL 为例。当我们在 PG 中执行这条 sql 时,内核在语义分析阶段会将其规范化后计算哈希值。这个 sql 中,如果将 id<300 改成 id<400 ,它们对应的规范化 sql 仍然是同样的,queryid 也是同样的。

如果启用了 pg_stat_statements 插件,会看到其规范化后的 sql 语句 SELECT id, data FROM tbl_a WHERE id < $1 ORDER BY data; 和计算出来的 queryid。
在这里插入图片描述

如何计算 queryid

众所周知,PG 在处理 SQL 时,会经过 词法分析->语法分析->语义分析->生成计划->执行计划 等阶段,而 queryid 的计算就是在语义分析阶段的 JumbleQuery 函数中完成的。

还以上文的 SQL SELECT id, data FROM tbl_a WHERE id < 300 ORDER BY data; 为例,语义分析阶段后,内核已经得到了 SQL 对应的 query 结构,如下图所示。(借用 interdb.jp [1] 文章中的图)

在这里插入图片描述
内核对所有需要 jumble 的结构都设定了对应 jumble 的方法,维护在 queryjumblefuncs.switch.c 文件中,下面简单列几行

case T_Alias:_jumbleAlias(jstate, expr);break;
case T_RangeVar:_jumbleRangeVar(jstate, expr);break;
case T_TableFunc:_jumbleTableFunc(jstate, expr);break;static void
_jumbleAlias(JumbleState *jstate, Node *node)
{Alias *expr = (Alias *) node;JUMBLE_STRING(aliasname);JUMBLE_NODE(colnames);
}

而对应到每个最终的结构上时,使用 AppendJumble 函数进行处理。将所有的输入都转成 unsigned char* 存到 jstate->jumble 变量里。如果发现长度满了就把之前的哈希一下从头开始存

static void
AppendJumble(JumbleState *jstate, const unsigned char *item, Size size)
{unsigned char *jumble = jstate->jumble;Size		jumble_len = jstate->jumble_len;/** Whenever the jumble buffer is full, we hash the current contents and* reset the buffer to contain just that hash value, thus relying on the* hash to summarize everything so far.*/while (size > 0){Size		part_size;if (jumble_len >= JUMBLE_SIZE){uint64		start_hash;start_hash = DatumGetUInt64(hash_any_extended(jumble,JUMBLE_SIZE, 0));memcpy(jumble, &start_hash, sizeof(start_hash));jumble_len = sizeof(start_hash);}part_size = Min(size, JUMBLE_SIZE - jumble_len);memcpy(jumble + jumble_len, item, part_size);jumble_len += part_size;item += part_size;size -= part_size;}jstate->jumble_len = jumble_len;
}

上述过程完成后,就得到了一个完整的 jumble 字符串。然后用内核的 hash_any_extend 对这个字符串进行哈希,得到的 64 位无符号整数就是 queryid(输出时会将其转为 int64)。

pg_stat_statement 生成规范化 sql

PG 内核所做的只是将一个 SQL 解析成 Query 结构,然后将所需要的部分拼起来哈希一下,得到一个 queryid,并没有规范化 sql 的概念。而 pg_stat_statement 的 generate_normalized_query 函数可以帮我们做到这一点,从
SELECT id, data FROM tbl_a WHERE id < 300 ORDER BY data;
生成
SELECT id, data FROM tbl_a WHERE id < $1 ORDER BY data; 规范化的 sql。

下面是函数的源码,代码很长,其实就是做了一件事:将 sql 中的常量替换成 $1、$2…

static char *
generate_normalized_query(JumbleState *jstate, const char *query,int query_loc, int *query_len_p)
{char	   *norm_query;int			query_len = *query_len_p;int			i,norm_query_buflen,	/* Space allowed for norm_query */len_to_wrt,		/* Length (in bytes) to write */quer_loc = 0,	/* Source query byte location */n_quer_loc = 0, /* Normalized query byte location */last_off = 0,	/* Offset from start for previous tok */last_tok_len = 0;	/* Length (in bytes) of that tok *//** Get constants' lengths (core system only gives us locations).  Note* this also ensures the items are sorted by location.*/fill_in_constant_lengths(jstate, query, query_loc);/** Allow for $n symbols to be longer than the constants they replace.* Constants must take at least one byte in text form, while a $n symbol* certainly isn't more than 11 bytes, even if n reaches INT_MAX.  We* could refine that limit based on the max value of n for the current* query, but it hardly seems worth any extra effort to do so.*/norm_query_buflen = query_len + jstate->clocations_count * 10;/* Allocate result buffer */norm_query = palloc(norm_query_buflen + 1);for (i = 0; i < jstate->clocations_count; i++){int			off,		/* Offset from start for cur tok */tok_len;	/* Length (in bytes) of that tok */off = jstate->clocations[i].location;/* Adjust recorded location if we're dealing with partial string */off -= query_loc;tok_len = jstate->clocations[i].length;if (tok_len < 0)continue;			/* ignore any duplicates *//* Copy next chunk (what precedes the next constant) */len_to_wrt = off - last_off;len_to_wrt -= last_tok_len;Assert(len_to_wrt >= 0);memcpy(norm_query + n_quer_loc, query + quer_loc, len_to_wrt);n_quer_loc += len_to_wrt;/* And insert a param symbol in place of the constant token */n_quer_loc += sprintf(norm_query + n_quer_loc, "$%d",i + 1 + jstate->highest_extern_param_id);quer_loc = off + tok_len;last_off = off;last_tok_len = tok_len;}/** We've copied up until the last ignorable constant.  Copy over the* remaining bytes of the original query string.*/len_to_wrt = query_len - quer_loc;Assert(len_to_wrt >= 0);memcpy(norm_query + n_quer_loc, query + quer_loc, len_to_wrt);n_quer_loc += len_to_wrt;Assert(n_quer_loc <= norm_query_buflen);norm_query[n_quer_loc] = '\0';*query_len_p = n_quer_loc;return norm_query;
}

参考资料

[1] https://www.interdb.jp/pg/pgsql03/01.html

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/36659.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

图论解法:哈密顿通路问题 Leetcode 2741. 特别的排列

描述 给你一个下标从 0 开始的整数数组 nums &#xff0c;它包含 n 个 互不相同 的正整数。如果 nums 的一个排列满足以下条件&#xff0c;我们称它是一个特别的排列&#xff1a; 对于 0 < i < n - 1 的下标 i &#xff0c;要么 nums[i] % nums[i1] 0 &#xff0c;要么…

【STM32-DAP 仿真器】

STM32-DAP 仿真器 ■ STM32-DAP仿真器介绍■ STM32-DAP仿真特点■ STM32-DAP仿真器实物图■ STM32-DAP高速 DAP 仿真器实物图■ STM32-DAP高速无线调试器 实物图■ STM32-DAP高速无线调试器示意图■ STM32-DAP高速无线调试器接线图■ STM32-DAP高速无线调试器接收端示意图 ■ S…

vcruntime140_1.dll是什么东东?vcruntime140_1.dll缺失的8个解决方法

当电脑出现找不到vcruntime140_1.dll,或vcruntime140_1.dll丢失无法打开软件怎么办&#xff1f;小编今天在本文详细为大家介绍解决方法与介绍vcruntime140_1.dll究竟是什么等vcruntime140_1.dll的问题。 一、vcruntime140_1.dll文件是什么 文件概述定义与功能 vcruntime140_…

【图像增强】基于retinex实现图像增强,SSR,MSR.MSRCR,MSRCP附Matlab代码

以下是基于Retinex算法实现图像增强的几种常见方法&#xff08;SSR、MSR、MSRCR、MSRCP&#xff09;的示例Matlab代码&#xff1a; SSR&#xff08;Single-Scale Retinex&#xff09;&#xff1a; matlab function enhanced_image SSR(image, sigma) log_image log(double(…

RuoYi-Vue-Plus (代码生成、Velocity模板引擎)

一、了解Velocity JSP、Freemarker、Velocity并称3大模版技术 下面是JSP、Freemarker和Velocity的简要对比表格: 特性/技术JSPFreemarkerVelocity设计目标视图层技术,与Servlet结合模板引擎,用于生成HTML模板引擎,用于生成各种文本输出与Java集成紧密集成,可以直接编写J…

CAN收发器

1、收发器的主要功能 &#xff08;1&#xff09;CAN通讯&#xff08;即报文收发&#xff09; MCU要CAN通讯&#xff1a;收发器模式切换至正常通讯模式&#xff08;Normal&#xff09;&#xff0c;正常通讯模式收发器能收能发。 MCU不要CAN通讯&#xff1a;把收发器切换至其它…

深入理解SQL优化:理论与实践的结合

深入理解SQL优化&#xff1a;理论与实践的结合 SQL优化是数据库性能优化的核心&#xff0c;通过优化SQL查询&#xff0c;可以极大地提高数据库的响应速度和资源利用效率。本文将以SQL优化的理论基础和实践应用为主线&#xff0c;结合具体案例&#xff0c;系统化地介绍如何有效…

format()函数

自学python如何成为大佬(目录):https://blog.csdn.net/weixin_67859959/article/details/139049996?spm1001.2014.3001.5501 语法介绍 format()可以对数据进行格式化处理操作&#xff0c;语法如下&#xff1a; format(value, format_spec) format_spec为格式化解释。当参数…

C++ STL Custom Iterator 自定义迭代器

#include <iostream> #include <iterator> #include <algorithm> class MyArray { public://演示自定义迭代器struct Iterator{/*第一步: 需要实现以下几种属性,这些属性是C++实现迭代器的约定,确保STL库算法可以使用该自定义迭代器 *///指定…

C语言笔记26 •顺序表应用•

基于动态顺序表实现通讯录项目 1.通讯录其实也就是顺序表&#xff0c;就是把里面存的数据类型变了一下 &#xff0c;所以有一些方法对于顺序表适用&#xff0c;对于通讯录也是适用的&#xff08;初始化&#xff0c;销毁&#xff0c;内存空间扩容&#xff09;。 2.要用到顺序表…

解决镜像加速问题

一、加速解决方案 -- 针对 Docker 运行时 1.1、配置阿里云镜像加速器 阿里云提供了免费使用的镜像加速服务。以下是具体的配置步骤&#xff1a; 登录到阿里云控制台 https://cr.console.aliyun.com/ 进入“镜像中心”&#xff0c;点击左侧菜单中的“镜像加速器”。 将页面中…

【设计模式】行为型-策略模式

策略模式&#xff0c;如春风吹过&#xff0c;随心所欲&#xff0c;变幻无穷&#xff0c;每一丝风都是一种选择。 文章目录 一、订单处理二、策略模式三、策略模式的核心组成四、运用策略模式五、策略模式的应用场景六、小结推荐阅读 一、订单处理 场景假设&#xff1a;有一个…

MySQL高级-索引-设计原则小结

文章目录 1、设计原则2、索引小结2.1、索引概述2.2、索引结构2.3、索引分类2.4、索引语法2.5、SQL性能分析2.6、索引使用2.7、索引设计原则 1、设计原则 针对于数据量较大&#xff0c;且查询比较频繁的表建立索引。针对于常作为查询条件&#xff08;where&#xff09;、排序&am…

2毛钱的SOT23-5封装28V、1.5A、1.2MHz DCDC转换器用于LCD偏置电源和白光LED驱动等MT3540升压芯片

前言 之前发了一个TI的BOOST升压芯片&#xff0c;用于LCD偏置电压或LED驱动&#xff0c;请访问以下链接。 6毛钱SOT-23封装28V、400mA 开关升压转换器&#xff0c;LCD偏置电源和白光LED应用芯片TPS61040 国产半导体厂家发展迅猛&#xff0c;今天推荐一个公司带“航天”的升压…

Java基础知识整理笔记

目录 1.关于Java概念 1.1 谈谈对Java的理解&#xff1f; 1.2 Java的基础数据类型&#xff1f; 1.3 关于面向对象的设计理解 1.3.1 面向对象的特性有哪些&#xff1f; 1.3.2 重写和重载的区别&#xff1f; 1.3.3 面向对象的设计原则是什么&#xff1f; 1.4 关于变量与方…

187. 导弹防御系统

Powered by:NEFU AB-IN Link 文章目录 187. 导弹防御系统题意思路代码 187. 导弹防御系统 题意 为了对抗附近恶意国家的威胁&#xff0c;R国更新了他们的导弹防御系统。 一套防御系统的导弹拦截高度要么一直 严格单调 上升要么一直 严格单调 下降。 例如&#xff0c;一套系…

代码随想录算法训练营第五十天 | 1143.最长公共子序列、1035.不相交的线、53. 最大子序和、392.判断子序复习

1143.最长公共子序列 题目链接&#xff1a;https://leetcode.cn/problems/longest-common-subsequence/ 文档讲解&#xff1a;https://programmercarl.com/1143.%E6%9C%80%E9%95%BF%E5%85%AC%E5%85%B1… 视频讲解&#xff1a;https://www.bilibili.com/video/BV1ye4y1L7CQ 最近…

swagger访问路径

Swagger 2.x 版本 访问地址&#xff1a;http://{ip}:{port}/{context-path}/swagger-ui.html {ip} 是你的服务器IP地址。 {port} 是你的应用服务端口&#xff0c;通常为8080。 {context-path} 是你的应用上下文路径&#xff0c;如果应用部署在根路径下&#xff0c;则为空。 …

搭建 MySQL MHA

搭建 MySQL MHA 搭建 MySQL MHA实验拓扑图实验环境实验思路MHA架构故障模拟 实验部署数据库安装主从复制部署时间同步主服务器配置从服务器配置创建链接 MHA搭建安装依赖的环境安装 node 组件安装 manager 组件配置无密码认证在 manager 节点上配置 MHA管理 mysql 节点服务器创…

Spring Cloud Alibaba之网关组件Gateway

实例演示1&#xff1a;在微服务体系中引入GateWay组件 创建一个ServiceForGateway的SpringBoot项目&#xff0c;通过在控制类编写方法对外提供服务 RestController public class Controller {RequestMapping("/getAccount/{id}")public String getAccount(PathVaria…