Redis第四讲——Redis的数据库结构、删除策略及淘汰策略

一、redis中的数据库

  • redis服务器将所有数据库都保存在服务器状态redis.h/redisServer结构的db数组中。
  • db数组的每项都是一个redis.h/redisDb结构,而每个redisDb结构就代表一个数据库。
  • 在初始化服务器时,程序会根据服务器状态的dbnum属性来决定应该创建多少个数据库。
struct redisServer {// ...// 一个数组,保存着服务器中的所有数据库redisDb *db;// ...// 服务器的数据库数量int dbnum;// ...
};

dbnum属性的值是由redis.conf配置文件中的databases来决定的,默认为16个。

二、数据库的切换(select命令)

我们先用redis可视化工具连上我们本地的redis,如图:

默认情况下,Redis客户端的目标数据库为0号数据库,但可以用select命令来切库:  

在服务器内部,客户端状态redisClient结构的db属性记录了客户端当前的目标数据库,这个属性是一个指向redisDb结构的指针:

typedef struct redisClient {
// ...
// 记录客户端当前正在使用的数据库
redisDb *db;
// ...
} redisClient;

简单地说就是:通过修改redisClient.db指针,让它指向服务器中的不同数据库,就可以实现切换数据库的功能——这就是select命令的实现原理。

三、数据库键空间(key space)

redis是一个键值对(key-value)的数据库,每个数据库都由一个redis.h/redisDb结构表示,而redisDb结构的dict字典则保存了数据库中所有键值对,我们通常称之为键空间(key space

typedef struct redisDb {//数据库键空间,保存数据库中所有键值对dict *dict;                 dict *expires;    //过期字典,保存键的过期时间(4.2会提到)          dict *blocking_keys;        dict *ready_keys;          dict *watched_keys;         int id;                    long long avg_ttl;      
} redisDb;

键空间的每个键(key)都是字符串对象,而值(value)则可以是字符串、列表、哈希、集合等对象中的任意一种。

举个例子:

 执行上述命令后,数据库的键空间将会是下图的样子:

四、过期键

有时候我们希望给某些键一个过期时间,即希望它存活一段时间就失效,redis同样也给我们提供了这样的机制。

4.1 设置过期时间

4.1.1 expire和pexpire

expire用于设定某个键的过期时间,单位是秒,格式如下:

expire [key] [time]

127.0.0.1:6379> set hello world
OK
127.0.0.1:6379> get hello
"world"
127.0.0.1:6379> expire hello 10
(integer) 1
127.0.0.1:6379> get hello
(nil)

可以看到,10秒后redis删除了hello键,与之对应的还有一个pexpire命令,它的time时间单位为毫秒,即[pexpire hello 5]经过5毫秒后删除hello键。

4.1.2 expireat和pexpireat

expireat用于设定某个键在某个具体Unix时间戳过期,单位为秒,基本格式如下:

expireat [key] [time]

127.0.0.1:6379> set hello world
OK
127.0.0.1:6379> time
1) "1704285269"  //当前Unix时间戳
2) "434279"
127.0.0.1:6379> expireat hello 1704285289  //时间戳到1704285289时删除
(integer) 1 
127.0.0.1:6379> get hello
(nil)

过期键会在我们指定的Unix时间戳删除,当然它也有一个对应毫秒单位的命令——pexpireat

ps:当然也可以用setex,在设置一个字符串键的同时设置过期时间,但他仅限于string数据类型,这里就不介绍了。

4.1.3 ttl、pttl和persist

ttlpttl两个命令用于查看过期键还剩余多少时间。

127.0.0.1:6379> set hello world
OK
127.0.0.1:6379> expire hello 20
(integer) 1
127.0.0.1:6379> ttl hello
(integer) 17
127.0.0.1:6379> pttl hello
(integer) 10317 //毫秒单位,约为10.3秒

persist用于移除某个键的过期时间,使其永久有效:

127.0.0.1:6379> set hello world
OK
127.0.0.1:6379> expire hello 100
(integer) 1
127.0.0.1:6379> ttl hello
(integer) 96
127.0.0.1:6379> persist hello //移除hello键过期时间
(integer) 1 
127.0.0.1:6379> ttl hello
(integer) -1  //-1表示永久有效

4.2 保存过期时间

redisDb结构的expires指针保存了数据库中所有键的过期时间,我们称之为过期字典:

  • 过期字典的键是一个指针,这个指针指向键空间中的某个键对象。
  • 过期字典的值是一个longlong类型的整数,这个整数保存了键所指向的数据库键的过期时间——一个毫秒精度的UNIX时间戳

我们给person、abc键设置过期时间:

127.0.0.1:6379> pexpireat person 1735660800000 //2025年1月1日 00:00:00
(integer) 1
127.0.0.1:6379> pexpireat abc 1735664400000  //2025年1月1日 01:00:00
(integer) 1
127.0.0.1:6379> pttl person
(integer) 31374276693
127.0.0.1:6379> pttl abc
(integer) 31377871933

那么此时对应的键空间如下图:

 

redis判断键是否过期的大致步骤如下:

  • 检查键是否存在过期字典,如果存在则取到过期时间。
  • 判断当前UNIX时间戳是否大于键的过期时间,如果是,那么此键就过期,反之则未过期。

五、删除策略(避免内存泄漏)

我们每设置一个键的过期时间,redis就会在过期字典中保存一份。当键过期后,如果没有触发删除策略的话,过期后的数据依然会保存在内存中,即便已经过期,我们还是能够获取到这个键的数据。那么它们如何被删除呢,有三种策略,下面我们介绍下。

5.1 定时删除

  • 定时删除:在设置键的过期时间同时,创建一个定时器(timer),到了过期时间,立即执行对建的删除操作。

很显然,这是一种时间换空间的做法:

  • 优点:对内存友好,通过定时器可以保证过期的建尽可能快的被删除,从而释放内存。

  • 缺点:

    • 对CPU很不友好,在过期键比较多的情况下,删除操作会占用一部分CPU时间,在内存不紧张但CPU紧张的情况下,将CPU时间用在删除和当前任务无关的过期键上,无疑会对服务器的响应时间和吞吐量造成影响。

    • 除此之外,创建一个定时器需要用到redis服务器中的时间事件,而当前时间事件的实现方式——无序链表,查找一个事件的时间复杂度位O(N)——并不能高效地处理大量时间事件。

5.2 惰性删除

  • 不会主动去删除过期的键,而是在你要获取某个键时,会先检查一下这个键是否过期,如果没过期就返回给你,过期就会删除这个键。

很显然,这是一种空间换时间的做法:

  • 优点:对CPU友好,程序只会在获取键的时候进行过期检查,并不会在删除其它无关的过期键上花费任何CPU时间。

  • 缺点:对内存不友好,如果有非常多的过期键,并且这些键不会被访问到,那么它们将会永远不会被删除(除非flushdb),这可能会导致内存泄漏的风险。

5.3 定期删除

  • 每隔一段时间,程序就对数据库进行一次检查,删除里面的过期键。

定期删除则是对定时和惰性删除的一种折中方案:

  • 优点:

    • 定期删除策略每隔一段时间执行一次删除过期键的操作,并会限制删除操作执行的时长和频率来减少对CPU时间的影响。

    • 通过定期删除,可以有效地减少了因为过期键带来的内存浪费。

  • 缺点:

    • 如果删除操作执行太频繁或时间太长,定期删除则会退化为定时删除。

    • 如果删除操作执行的太少,又会退化为惰性删除。

所以,定期删除虽然是一个这种方案,但执行时长和频率难以把握。

5.4 redis中的删除策略

前面提到了三种策略,而redis采用的则是惰性删除+定期删除两种策略,那么它俩之间是如何配合的呢,我们一起来看看。

5.4.1 惰性删除

惰性删除策略由db.c/expireIfNeeded函数实现,所有读写数据库的redis命令在执行之前都会调用该函数对输入键进行检查,大致流程也很简单:

  • 对所有读写命令进行检查(调用expireIfNeeded函数)。

  • 判断键是否过期,如果过期则删除键,没过期就不做任何操作。

ps:甭管键过没过期都会执行实际的命令流程,比如get命令,如果键过期则会被删除,返回结果为null,如果没过期就返回实际的值。

5.4.2 定期删除

定期删除由redis.c/activeExpireCycle函数实现,redis默认每隔100ms就随机抽取部分设置了过期时间的key,检查这些key是否过期,如果过期就删除。

100ms的执行周期是默认的,可以在redis.conf文件中更改:

它的执行频率由hz参数值指定,默认是10,也就是每一秒执行10次。

注释翻译:

Redis调用内部函数执行许多后台任务,例如关闭超时的客户端连接,清除从未被请求的过期键等。 并非所有任务的执行频率都相同,但Redis会根据指定的“hz”值检查要执行的任务。 “hz”被设置为10。提高该值将在Redis空闲时使用更多的CPU,但同时在有许多键同时过期且需要更高的精度的情况下,会使Redis的响应更快。 范围介于1和500之间。然而,通常不建议超过100的值,而应该默认使用10,并将其升至100的值仅适用于需要非常低延迟的环境。大多数用户不需要设置高于10的“hz”值。

5.0版本之前,hz参数一旦设定就会被固定,但如果链接数比较多的情况下,10的默认值可能就不能够满足这种情况,就需要手动去更改hz的值,这样就很不方便。

redis 5.0之后,有了dynamic-hz参数,默认就是打开的,当连接数很多时,就会自动加倍hz,以便处理更多的链接:

注释翻译:

通常情况下,拥有与连接的客户端数量成比例的 Hz 值是很有用的。例如,这对于在每次后台任务调用期间避免处理太多客户端以避免延迟峰值是很有用的。 由于默认情况下,HZ 值被保守地设置为 10,Redis 提供并默认启用了使用自适应 Hz 值的能力,该值在存在许多连接的情况下会临时增加。 启用动态 Hz 时,实际配置的 Hz 值将作为基线使用,但在连接更多客户端时,将根据需要使用配置的 Hz 值的倍数。这样,空闲实例的 CPU 时间将很少,而繁忙实例将更加响应。

那么它到底是这么删的呢,源码如下

for (j = 0; j < dbs_per_call; j++) {int expired;redisDb *db = server.db+(current_db % server.dbnum);current_db++;/* 超过25%的key已过期,则继续. */do {unsigned long num, slots;long long now, ttl_sum;int ttl_samples;/* 如果该db没有设置过期key,则继续看下个db*/if ((num = dictSize(db->expires)) == 0) {db->avg_ttl = 0;break;}slots = dictSlots(db->expires);now = mstime();/*但少于1%时,需要调整字典大小*/if (num && slots > DICT_HT_INITIAL_SIZE &&(num*100/slots < 1)) break;expired = 0;ttl_sum = 0;ttl_samples = 0;if (num > ACTIVE_EXPIRE_CYCLE_LOOKUPS_PER_LOOP)num = ACTIVE_EXPIRE_CYCLE_LOOKUPS_PER_LOOP;// 20while (num--) {dictEntry *de;long long ttl;if ((de = dictGetRandomKey(db->expires)) == NULL) break;ttl = dictGetSignedIntegerVal(de)-now;if (activeExpireCycleTryExpire(db,de,now)) expired++;if (ttl > 0) {/* We want the average TTL of keys yet not expired. */ttl_sum += ttl;ttl_samples++;}}/* Update the average TTL stats for this database. */if (ttl_samples) {long long avg_ttl = ttl_sum/ttl_samples;/样本获取移动平均值 */if (db->avg_ttl == 0) db->avg_ttl = avg_ttl;db->avg_ttl = (db->avg_ttl/50)*49 + (avg_ttl/50);}iteration++;if ((iteration & 0xf) == 0) { /* 每迭代16次检查一次 */long long elapsed = ustime()-start;latencyAddSampleIfNeeded("expire-cycle",elapsed/1000);if (elapsed > timelimit) timelimit_exit = 1;}/* 超过时间限制则退出*/if (timelimit_exit) return;/* 在当前db中,如果少于25%的key过期,则停止继续删除过期key */} while (expired > ACTIVE_EXPIRE_CYCLE_LOOKUPS_PER_LOOP/4);
}

大致的逻辑如下:

  • 依次遍历每个db(默认是16个),针对每个db随机选择20个设置了生存时间的(ACTIVE_EXPIRE_CYCLE_LOOKUPS_PER_LOOP)键,并对过期的键进行删除。
  • 如果被删除的key超过了25%,再次随机筛选出20个设置了生存时间的key....
  • 如果被删除的key不超过25%,这次定期删除结束。

六、内存淘汰策略(避免内存溢出)

本来没想介绍这节的,但发现删除策略和淘汰策略关系还挺密切的,索性一起介绍了吧。

我们现在想一个问题,定期+惰性可以保证过期的key一定会被删掉,但是只能保证最终一定会被删除,要是定期删除遗漏了大量的过期键,而且很长一段时间都不会访问这些键,那么久而久之redis内存可能会被耗尽,由于可能会存在这样的问题,所以redis又引入了“内存淘汰机制”来解决:

当Redis的内存空间不足,还需要再存储数据时,就会触发淘汰策略,默认策略就是抛出异常…………

  • volatile-lru -> Evict using approximated LRU among the keys with an expire set.

        在设置了生存时间的key中,采用最近最少使用的策略删除key

  • allkeys-lru -> Evict any key using approximated LRU.

        在全部的key中,采用最近最少使用的策略删除key

  • volatile-lfu -> Evict using approximated LFU among the keys with an expire set.

        在设置了生存时间的key中,采用最近最少频次使用的策略删除key

  • allkeys-lfu -> Evict any key using approximated LFU.

        在全部的key中,采用最近最少频次使用的策略删除key

  • volatile-random -> Remove a random key among the ones with an expire set.

        闹着玩,随机删……

  • allkeys-random -> Remove a random key, any key.

        闹着玩,随机删……

  • volatile-ttl -> Remove the key with the nearest expire time (minor TTL)

        在设置了生存时间的key中,删除剩余生存时间最少的key

  • noeviction(默认策略) -> Don't evict anything, just return an error on write operations.

        抛出异常!

那么如何选择,以下是腾讯针对redis淘汰策略给出的建议:

  • 当redis作为缓存使用的时候,推荐使用allkeys-lru。该策略会将最近最少使用的key淘汰。默认情况下,使用频率最低则后期命中的概率也最低,所以将其淘汰。
  • 当redis作为半缓存半持久化使用时,可以用volatile-lru。因为redis本身不建议保存持久化数据,所以只做备选方案。

 End:希望对大家有所帮助,如果有纰漏或者更好的想法,请您一定不要吝啬你的赐教🙋。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/601270.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

outlook邮件群发单显技巧?群发怎么单显?

outlook邮件群发单显如何设置&#xff1f;QQ邮箱怎么群发单显&#xff1f; 在群发邮件时&#xff0c;如何让每个收件人只看到自己的名字&#xff0c;而不是其他人的名字&#xff0c;这就涉及到所谓的“单显”技巧。下面蜂邮EDM就为大家揭秘Outlook邮件群发单显的奥秘。 outlo…

实战干货:用 Python 批量下载百度图片!

为了做一个图像分类的小项目&#xff0c;需要制作自己的数据集。要想制作数据集&#xff0c;就得从网上下载大量的图片&#xff0c;再统一处理。 这时&#xff0c;一张张的保存下载&#xff0c;就显得很繁琐。那么&#xff0c;有没有一种方法可以把搜索到的图片直接下载到本地电…

Spark 运行架构

Spark 框架的核心是一个计算引擎&#xff0c;整体来说&#xff0c;它采用了标准 master-slave 的结构。 如下图所示&#xff0c;它展示了一个 Spark 执行时的基本结构。图形中的 Driver 表示 master&#xff0c; 负责管理整个集群中的作业任务调度。图形中的 Executor 则是 sla…

Swift爬虫使用代理IP采集唯品会商品详情

目录 一、准备工作 二、代理IP的选择与使用 三、使用Swift编写唯品会商品爬虫 四、数据解析与处理 五、注意事项与优化建议 六、总结 一、准备工作 在开始编写爬虫之前&#xff0c;需要准备一些工具和库&#xff0c;以确保数据抓取的顺利进行。以下是所需的工具和库&…

Mac 软件出现「意外退出」及「打不开」解决方法

Mac 软件出现「意外退出」及「打不开」解决方法 软件出现意外退出及软件损坏的情况&#xff0c;这是因为苹果删除了TNT的证书&#xff0c;所以大部分TNT破解的Mac软件会出现无法打开&#xff0c;提示意外退出。 终端需先安装Xcode或Apple命令行工具 如未装Xcode可以使用下列命…

【算法设计与分析】分治-时间复杂度计算

目录 主定理 Master Theorem分治算法运行时间的递归表示主定理的简化形式 主定理的一般形式 递归树 Recursion Tree递归树的简单结论 主定理 Master Theorem 分治算法运行时间的递归表示 将原问题分解成 a 个子问题递归求解&#xff0c;每个子问题的规模是原问题的 1/b。同时子…

go-cqhttp作者停止维护——替代品OpenShamrock的使用方法

目录 前言 解决办法 配置要求 实操 刷入面具 安装lsp框架 安装OpenShamrock和QQ 注意 大功告成 前言 由于QQ官方针对协议库的围追堵截&#xff0c;go-cqhttp已经无力维护下去了 原文连接 QQ Bot的未来以及迁移建议 Issue #2471 Mrs4s/go-cqhttp (github.com)https…

最新GPT4.0使用教程,AI绘画,ChatFile文档对话总结+GPT语音对话使用,DALL-E3文生图

一、前言 ChatGPT3.5、GPT4.0、GPT语音对话、Midjourney绘画&#xff0c;文档对话总结DALL-E3文生图&#xff0c;相信对大家应该不感到陌生吧&#xff1f;简单来说&#xff0c;GPT-4技术比之前的GPT-3.5相对来说更加智能&#xff0c;会根据用户的要求生成多种内容甚至也可以和…

16.顺子日期(14)

题目 public class Main {public static boolean isLegal(String date) {int l 0;int n date.length();while(l<(n-3)) {int t1 (int)Integer.valueOf(date.substring(l,l1));int t2 (int)Integer.valueOf(date.substring(l1,l2));int t3 (int)Integer.valueOf(date.s…

FreeRTOS 实时操作系统第十二讲 - 计数信号量

一、信号量的概念 1、信号量的基本概念 消息队列是实现任务与任务或任务与中断间通信的数据结构&#xff0c;可类比裸机编程中的数组 信号量是实现任务与任务或任务与中断间通信的机制&#xff0c;可以类比裸机编程中的标志位 信号量 (semaphore) 可以实现任务与任务或任务与中…

银河麒麟Kylin-Server-V10-SP3使用ISO镜像搭建本地内网YUM/DNF源cdrom/http

机房服务器安装一般是内网环境&#xff0c;需要配置本地的YUM/DNF源。本文介绍通过ISO镜像搭建内网环境的UM/DNF源 准备工作&#xff1a; 提前准备好Kylin-Server-V10-SP3的ISO镜像文件。 本机IP地址&#xff1a;192.168.40.201 镜像存放目录/data/iso/Kylin-Server-V10-SP3-Ge…

Linux-端口、nmap命令、netstat命令

端口是设备与外界通讯交流的出入口&#xff0c;可分为物理端口和虚拟端口 物理端口实际存在可以看见&#xff0c;而虚拟端口是指计算机内部的端口&#xff0c;是不可见的&#xff0c;用来操作系统和外部交互使用。 IP地址不能锁定程序&#xff0c;所以可以通过端口&#xff0…

原生微信小程序如何动态修改svg图片颜色及尺寸、宽高(封装svgIcon组件)解决ios不显示问题

最终效果 前言 动态设置Svg图片颜色就是修改Svg源码的path中的fill属性&#xff0c; 通过wx.getFileSystemManager().readFile读取.xlsx文件 ios不显示需要把encoding设置 binary 把文件转成base64 封装svg-icon组件 1、在项目的components下新建svg-icon文件夹&#xff0c;新…

OA系统与工单系统的区别:功能、应用与优势对比

很多企业在选购系统的时候会陷入选择困难症的漩涡。市面上的各种系统&#xff0c;比如ERP系统、OA系统、工单系统等等让人眼花缭乱。想要选择一款合适的系统&#xff0c;前提是明确地知道自己需要用它来做什么&#xff0c;其次去了解每个系统的应用场景、功能等是否与自己的需求…

自动驾驶感知-预测-决策-规划-控制学习(3):感知方向文献阅读笔记

提示&#xff1a;文章写完后&#xff0c;目录可以自动生成&#xff0c;如何生成可参考右边的帮助文档 文章目录 前言一、文章主题二、摘要阅读1.名词理解①点云是什么&#xff1f;②二维图像分割器③轻量化卷积网络提取特征④单模态表达和多模态特征融合的区别⑤基于ROS的多传感…

jetson deepstream 解码接入编码输出

不需要编解码输出画面的直接到7 使用就行 1 jetson主板编译工具 在jetson主板上安装gstreamer工具链&#xff0c;编译opencv sudo apt install -y libgstreamer1.0-dev libgstreamer-plugins-base1.0-dev gstreamer1.0-plugins-ugly gstreamer1.0-rtsp python3-dev pytho…

安全与认证Week3 Tutorial+历年题补充

目录 1) 什么是重放攻击? 2)什么是Kerberos系统?它提供什么安全服务? 3)服务器验证客户端身份的一种简单方法是要求提供密码。在Kerberos中不使用这种身份验证&#xff0c;为什么?Kerberos如何对服务器和客户机进行身份验证? 4) Kerberos的四个要求是什么?Kerberos系…

C++日期类的实现

前言&#xff1a;在类和对象比较熟悉的情况下&#xff0c;我们我们就可以开始制作日期表了&#xff0c;实现日期类所包含的知识点有构造函数&#xff0c;析构函数&#xff0c;函数重载&#xff0c;拷贝构造函数&#xff0c;运算符重载&#xff0c;const成员函数 1.日期类的加减…

JetBrains Rider使用总结

简介&#xff1a; JetBrains Rider 诞生于2016年&#xff0c;一款适配于游戏开发人员&#xff0c;是JetBrains旗下一款非常年轻的跨平台 .NET IDE。目前支持包括.NET 桌面应用、服务和库、Unity 和 Unreal Engine 游戏、Xamarin 、ASP.NET 和 ASP.NET Core web 等多种应用程序…

面试题--消失的两个数字(困难)

个人主页&#xff1a;Lei宝啊 愿所有美好如期而遇 目录 本题链接 输入描述 输出描述 算法分析 触类旁通一&#xff1a;消失的数字 题目分析 图示 解题源码 触类旁通二&#xff1a;只出现一次的数字III 题目分析 图示 解题源码 本题分析 解题源码 本题链接 力…