Redis内存策略:「过期Key删除策略」+ 「内存淘汰策略」

Redis之所以性能强,最主要的原因就是基于内存存储,然而单节点的Redis其内存大小不宜过大,否则会影响持久化或主从同步的性能。

Redis内存满了,会发生什么?

  • 在Redis的运行内存达到了某个阈值,就会触发内存淘汰机制  =>  防止把内存撑爆,这个阈值就是我们设置的最大运行内存。 

我们可以通过修改redis.conf配置文件来设置Redis的最大内存,配置项为maxmemory:

  • Redis默认情况下是没有对最大内存大小做限制的,默认情况下Redis就是根据你当前的服务器里面,当前最多可以申请到的内存大小来去做限制! 
# 格式:
# maxmemory <bytes>
# 例如:
maxmemory 1gb

当内存使用达到上限,就无法存储更多数据了,因此,为了解决这个问题,Redis内部会有两套内存回收的策略:

  • 内存过期策略
  • 内存淘汰策略

内存过期策略 - 过期key处理 - 过期删除策略

如何设置过期时间?
  1. expire key n秒     
  2. pexpire key  n毫秒     
  3. set   key  value  ex  n秒   
  4. set  key  value nx  n毫秒

查看某个key剩余的存活时间:TTL  key 

  • 我们可以通过expire / EX命令给Redis的key设置TTL(过期时间 / 存活时间),单位:秒,当key的TTL到期以后,即当过期时间到了以后,再次访问该key时返回的是nil,说明这个Key已经不存在了,对应的内存也得到释放,从而起到内存回收的目的。
# 写入一条数据
set num 123
# 设置20秒过期时间
expire num 20
# 写入一条数据并设置20s过期时间
set num EX 20

Redis是如何知道一个key是否过期呢?

  • Redis本身是一个典型的key-value的键值型内存存储数据库,因此所有的key-value都保存在Dict结构中,在其redisDb结构体中,有两个Dict,也就是哈希表:一个用来记录KEY-VALUE键值对(当然存的不是真正的Key-Value,存储的其实是RedisObject对应的内存地址的指针),另一个用来记录key的TTL。

过期字典存储在 redisDb 结构中,如下: 

来看下redisDb的底层源码:

typedef struct redisDb {dict dict;                 / The keyspace for this DB , 也就是存放KEY和VALUE的哈希表*/dict *expires;              /* 同样是哈希表,但保存的是设置了TTL的KEY,及其到期时间*/dict *blocking_keys;        /* Keys with clients waiting for data (BLPOP)*/dict *ready_keys;           /* Blocked keys that received a PUSH */dict *watched_keys;         /* WATCHED keys for MULTI/EXEC CAS /int id;                     / Database ID, 0 ~ 15 /long long avg_ttl;          / Average TTL, just for stats /unsigned long expires_cursor; / Cursor of the active expire cycle. */list *defrag_later;         /* List of key names to attempt to defrag one by one, gradually. */
} redisDb;

每当我们对一个key设置了过期时间后,Redis会把该key带上过期时间存储到一个过期字典(expires dict)中,也就是说「过期字典」保存了数据库中所有 key 的过期时间。 

当我们查询一个 key 时,Redis 首先检查该 key 是否存在于过期字典中:

  • 如果不在,则正常读取键值;
  • 如果存在,则会获取该 key 的过期时间,然后与当前系统时间进行比对,如果比系统时间大,那就没有过期,否则判定该 key 已过期    =>   查询到对应的TTL,加以判断即可。

是不是TTL到期就立即删除了呢? 

TTL(Time To Live)的含义是存活时间。 

  • Redis并不会在Key过期时立刻删除KEY,因为要实现这样的效果就必须给每一个过期Key设置一个定时器,并监控这些Key的过期状态,然后去做判断,在key过期的那一刻给它立刻删掉   =>  定时删除它的优点就是保证过期key会被尽快删除,也就是内存可以尽快得到释放,因此,定时删除对内存是最友好的;
  • 如果说我们的key比较少那还好,但是如果我们的key非常的多,达到数十万甚至数百万,那么这些key如果我们都给它设置这样一个定时器,无论是对CPU还是对内存都会带来极大的负担,这样一来,就会严重影响到Redis服务本身的一个性能,所以说这个是没有办法接受的,因此,我们在实际应用当中,Redis采用的并不是立即删除,而是惰性删除  + 周期删除  =>   Redis 使用的过期删除策略是惰性删除+定期删除这两种策略配和使用。

Redis的过期KEY删除策略有两种:

  • 惰性删除

  • 周期删除或定期删除

惰性删除

  • 顾名思义就是TTL过期后不会立刻删除,惰性删除策略的做法是,不主动删除过期键,而是在访问使用一个key的时候,判断当前key有没有设置TTL过期时间,如果有,则检查该key的存活时间,如果发现key已经过期才执行删除操作。 

惰性删除策略的优缺点:

优点:
  • 因为每次访问时,才会检查该key是否过期,因此惰性删除策略可以节省CPU资源,对CPU时间最友好。
缺点:
  • 如果一个key已经过期,而这个key又仍然保留在数据库中,那么只要这个过期key一致没有被访问,它所占用的内存就不会释放,会造成一定的内存空间浪费,所以惰性删除策略对内存不友好   =>   这不就是会导致内存泄漏吗???

周期删除 / 定期删除策略

  • 顾名思义就是通过一个定时任务,每隔一段时间周期性的从数据库中抽取一定数量的key进行检查,并删除其中的过期key。

Redis默认会每秒进行10次过期检查(此配置可以通过Redis的配置文件redis.conf进行配置,配置键为hz,它的默认值是hz 10),每次检查数据库并不是遍历过期字典中的所有key,而是从数据库中随机抽取一定数量的key进行过期检查:

  1. 从过期字典中随机抽取20个key;
  2. 检查这20个key是否过期,并删除已过期的key;
  3. 如果本轮检查的已过期key的数量,超过5个(5 / 20 = 1 / 4 = 25%),也就是「已过期 key 的数量」占比「随机抽取 key 的数量」大于 25%,则继续随机抽查,重复步骤1;如果已过期的key的比例小于25%,则停止继续删除过期key,退出本轮检查,然后等待下一轮再检查。 

可以看到,定期删除是一个循环的流程

Redis为了保证定期删除不会出现循环过度,导致线程卡死现象,为此增加了定期删除循环流程的时间上限,默认不会超过25ms,超出时间限制则退出。 

定期删除策略的优缺点

优点:
  • 定期删除是Redis的主动删除策略,它可以确保过期key能够及时被删除
缺点:
  • 会占用CPU资源去扫描key,可能会影响到Redis的性能 

可以看到,惰性删除策略和定期删除策略都有各自的优缺点,所以Redis选择「惰性删除+定期删除」这两种策略配和使用,以求在合理使用 CPU 时间和避免内存浪费之间取得平衡。 

如果过期键没有被访问,而定期删除又跟不上新键产生的速度,内存不就慢慢耗尽了吗? 

内存淘汰策略

内存淘汰:

  • 就是当Redis的内存使用达到设置的阈值时,Redis就会主动挑选部分key删除以释放更多内存的流程,这就叫做内存淘汰机制。

内存淘汰时机

当内存达到阈值时执行内存淘汰,但问题是Redis什么时候会去判断内存是否达到阈值呢?

  • Redis每次执行任何命令时,都会判断内存是否达到阈值。

当Redis内存不足时会怎么做?

  • 这取决于配置的内存淘汰策略,Redis支持很多种内存淘汰策略,例如LRU、LFU、Random,但默认的策略是直接决绝新的写入请求,而如果设置了其它策略,则会在每次执行命令后判断内存占用是否达到阈值,如果达到阈值则会基于配置的内存淘汰策略尝试进行内存淘汰,直到占用内存小于阈值为止。 

Redis 内存淘汰策略有哪些? 

Redis支持内存淘汰,配置参数maxmemory-policy决定了内存淘汰策略,这个参数一共有8个枚举值,也就是说Redis内存淘汰策略共有8种这八种策略大体分为「不进行数据淘汰」和「进行数据淘汰」两类策略:

1. 不进行数据淘汰的策略

  • noevictionRedis3.0之后,默认的内存淘汰策略) :禁止删除数据,它表示当Redis的运行内存超过最大设置内存时,也就是当Redis内存满时,不淘汰任何键值对数据,而是不再提供服务,不允许写入新数据,Redis的写命令会直接返回错误信息(但是读命令还是可以正常返回)。

 

2. 进行数据淘汰的策略

针对「进行数据淘汰」这一类策略,又可以细分为「在设置了过期时间的数据中进行淘汰」和「在所有数据范围内进行淘汰」这两类策略。 在设置了过期时间的数据中进行淘汰:

  • volatile-random随机淘汰设置了过期时间的任意键值 - 从已设置过期时间的数据集中任意选择数据淘汰;
  • volatile-ttl从已设置过期时间的数据集中挑选将要过期的数据淘汰:比较key的剩余TTL值,TTL越小越先被淘汰。
  • volatile-lru(Redis3.0 之前,默认的内存淘汰策略):LRU(Least Recently Used),最近最久未使用,利用LRU算法淘汰所有设置了TTL过期时间的键值中,最久未使用的键值;
  • volatile-lfu(Redis 4.0 后新增的内存淘汰策略):LFU(Least Frequently Used),最少频率使用,淘汰所有设置了TTL过期时间的键值中,最少使用的键值;

在所有数据范围内进行淘汰:

  • allkeys-random:对全体key,随机进行淘汰;
  • allkeys-lruLRU(Least Recently Used),最近最久未使用,淘汰全体键值中最久未使用的键值;
  • allkeys-lfuRedis 4.0 后新增的内存淘汰策略)::LFU(Least Frequently Used),最少频率使用,淘汰整个键值中最少使用的键值,即访问频率最低的那个key-value

比较容易混淆的有两个算法:

  • LRU(Least Recently Used),最近最久未使用(根据访问时间淘汰),会选择淘汰最近最少使用的数据,用当前时间减去最后一次访问时间,这个值越大则淘汰优先级越高。
  • LFU(Least Frequently Used),最少频率使用(根据访问频率淘汰),会统计每个key的访问频率,值越小淘汰优先级越高。 

Redis 4.0开始支持基于LFU算法的淘汰策略! 

Redis为什么新增了LFU淘汰策略?

为什么Redis 4.0有了LFU?
  • 比如Redis中的一个键,之前一直都没有被访问过,最近突然被访问了一次,如果使用LRU淘汰策略就很难被淘汰,因为LRU会把它定义为热键;
  • 而使用LFU淘汰策略该key就可能很快被淘汰,因为LRU优先淘汰最近未被使用的,而LFU淘汰的是最近访问频率最低的。
  • LFU比LRU淘汰更精确,有助于提升Redis的缓存命中率。 

Redis怎么知道某个KEY的最后一次访问时间或者是访问频率呢? 

  • redisObject结构体当中的lru就是记录最近一次访问时间和访问频率的,以低8位无符号数字来记录逻辑访问次数。
  • 逻辑访问次数又是怎么回事呢?8位无符号数字最大才255,访问次数超过255怎么办?

逻辑访问次数是如何计算的?

  • 由于记录访问次数的只有8bit,即便是无符号数,最大值只有255,不可能记录真实的访问次数,因此LFU的访问次数之所以叫做逻辑访问次数,是因为并不是每次key被访问都计数,Redis统计的其实是逻辑访问次数,这其中是一个计算公式,会根据当前的访问次数做计算,结果要么是次数 + 1,要么是次数不变,且最大不超过255,除此以外,逻辑访问次数还有一个衰减周期,访问次数会随时间衰减,默认为1分钟,即每隔1分钟逻辑访问次数会 -1,这样逻辑访问次数就能基本反映出一个key的访问热度了。

 显然LFU的基于访问频率的统计更符合我们的淘汰目标,因此官方推荐使用LFU算法。 

内存淘汰用到的是LRU算法吗?

  • 嗯...Redis使用的是近似LRU算法,传统LRU算法的实现需要一个双向链表来记录数据最近被访问的顺序,最新操作的键会被移动到表头,当需要内存淘汰时,只需要删除链表尾部的数据即可,因为链表尾部的元素就代表最久未被使用的元素。 
  • 但是Redis中的KEY可能有数百万甚至更多,出于节省内存的考虑,Redis的LRU算法并非完整的实现,Redis的算法并不是真正的LRU,而是一种基于抽样的近似LRU算法!
  • Redis采用的是抽样法,即每次抽样一定数量(maxmemory-samples)的key,然后和目前维持的淘汰候选池综合比较,然后基于内存策略做排序,找出淘汰优先级最高的,删除这个key,这就使得算法的结果更接近于真正的LRU算法了,特别是在抽样值较高的情况下(例如10),可以达到与真正的LRU接近的结果。

当Redis作为缓存使用的时候,推荐使用allkeys-lru淘汰策略,该策略会将最近最久未使用的key淘汰,像这种key后期命中的概率也最低,所以将其淘汰。 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/605434.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

图神经网络入门

图神经网络&#xff08;GNN&#xff09;是一组在图领域工作的深度学习方法。 这些网络最近已应用于多个领域&#xff0c;包括&#xff1a; 组合优化、推荐系统、计算机视觉—仅举几例。 这些网络还可用于对大型系统进行建模&#xff0c;例如社交网络、蛋白质-蛋白质相互作用网络…

Python 数据类型有哪些?

Python 数据类型 Python 数据类型用于定义变量的类型。它定义了我们将在变量中存储哪种类型的数据。存储在内存中的数据可以有很多种类型。例如&#xff0c;一个人的年龄被存储为数值&#xff0c;他或她的地址被存储为字母数字字符。 Python 有各种内置数据类型&#xff0c;主…

软件测试方法分类-按测试对象划分

接上一篇,下来我们再细讲,第四个维度的分类, 软件测试方法分类-按测试对象划分 本章节重点介绍非功能测试的相关知识,因为功能测试的基本在之前的分类都是有涉及的。 一、非功能测试 1,性能测试(Performance Testing) 检查系统是否满足需求规格说明书中规定的性能。 …

pytorch07:损失函数与优化器

目录 一、损失函数是什么二、常见的损失函数2.1 nn.CrossEntropyLoss交叉熵损失函数2.1.1 交叉熵的概念2.2.2 交叉熵代码实现2.2.3 加权重损失 2.2 nn.NLLLoss2.2.1 代码实现 2.3 nn.BCELoss2.3.1 代码实现 2.4 nn.BCEWithLogitsLoss2.4.1 代码实现 三、优化器Optimizer3.1 什么…

android常用方法

获取应用安装来源 private String getAppInstaller(Context context, String packageName) {return context.getPackageManager().getInstallerPackageName(packageName);}判断是否系统应用 在/system/app 或者 /system/priv-app目录下的应用。 public boolean isSystem(Conte…

Redis入门-五种数据类型

大家好我是苏麟 , 今天来说说Reids五种基本数据类型 . 五种常用数据类型介绍 大纲 字符串操作命令哈希操作命令列表操作命令集合操作命令有序集合操作命令通用命令 Redis存储的是key-value结构的数据&#xff0c;其中key是字符串类型&#xff0c;value有5种常用的数据类型&…

导入导出(excel格式/压缩包格式导出至response、excel导入)

目录 导出一、excel格式导出至response1、List<对象>导出2、json对象不固定列导出 二、压缩包格式导出至response使用Hutool工具简化代码 导入一、对象导入二、不固定列导入 导出 一、excel格式导出至response 1、List<对象>导出 Map<String, String> hea…

零基础学Python网络爬虫案例实战全流程详解(入门与提高篇)

零基础学Python网络爬虫案例实战 全流程详解 入门与提高篇 零基础学Python网络爬虫案例实战 全流程详解 高级进阶篇 内容简介 在大数据时代的今天&#xff0c;无论是产品开始还是精准化营销越来越离不开大数据的支持&#xff0c;如何从浩瀚的网络中获取自己想要的大数据&…

用 Socket.D 替代原生 WebSocket 做前端开发

socket.d.js 是基于 websocket 包装的 socket.d 协议的实现。就是用 ws 传输数据&#xff0c;但功能更强大。 功能原生 websocketsocket.d说明listen有有监听消息send有有发消息sendAndRequest无有发消息并接收一个响应&#xff08;类似于 http&#xff09;sendAndSubscribe无…

PyTorch 简单易懂的实现 CosineSimilarity 和 PairwiseDistance - 距离度量的操作

目录 torch.nn子模块Distance Functions解析 nn.CosineSimilarity 功能 主要参数 输入和输出的形状 使用示例 nn.PairwiseDistance 功能 主要参数 输入和输出的形状 使用示例 总结 torch.nn子模块​​​​​​​Distance Functions解析 nn.CosineSimilarity torc…

【图神经网络导论】之第9章模型变体(刘知远)

第9章不同图类型的模型变体 文章目录 第9章不同图类型的模型变体9.1 有向图9.2 异构图9.3 带有边信息的图9.4 动态图9.5 多维图 第4章介绍的基础GNN模型"被用于处理无向图&#xff0c;这些图包含具有标签的节点&#xff0c;是最简单的图。然而&#xff0c;在现实世界中还有…

Linux基础知识点(八-POSXI互斥锁)

目录 一、互斥锁基本概念 1.1 互斥相关背景概念 1.2 互斥锁(mutex) 1.3 死锁 二、初始化互斥锁 2.1 静态初始化 2.2 动态初始化 三、获取与释放互斥锁 四、销毁互斥锁 一、互斥锁基本概念 1.1 互斥相关背景概念 临界资源&#xff1a;多线程执行流共享的资源就叫做…

【事务】事务传播级别

Spring事务定义了7种传播机制&#xff1a; PROPAGATION_REQUIRED&#xff1a;默认的Spring事物传播级别&#xff0c;若当前存在事务&#xff0c;则加入该事务&#xff0c;若不存在事务&#xff0c;则新建一个事务。 PAOPAGATION_REQUIRE_NEW&#xff1a;若当前没有事务&#x…

PyTorch 简单易懂的 Embedding 和 EmbeddingBag - 解析与实践

目录 torch.nn子模块Sparse Layers详解 nn.Embedding 用途 主要参数 注意事项 使用示例 从预训练权重创建嵌入 nn.EmbeddingBag 功能和用途 主要参数 使用示例 从预训练权重创建 总结 torch.nn子模块Sparse Layers详解 nn.Embedding torch.nn.Embedding 是 PyTo…

06.函数和模块的使用

函数和模块的使用 在讲解本章节的内容之前&#xff0c;我们先来研究一道数学题&#xff0c;请说出下面的方程有多少组正整数解。 事实上&#xff0c;上面的问题等同于将8个苹果分成四组每组至少一个苹果有多少种方案。想到这一点问题的答案就呼之欲出了。 可以用Python的程序来…

基于ssm的大湾区旅游推荐系统的设计与实现+vue论文

摘 要 如今社会上各行各业&#xff0c;都喜欢用自己行业的专属软件工作&#xff0c;互联网发展到这个时候&#xff0c;人们已经发现离不开了互联网。新技术的产生&#xff0c;往往能解决一些老技术的弊端问题。因为传统大湾区旅游景点信息管理难度大&#xff0c;容错率低&…

美创科技葛宏彬:夯实安全基础,对医疗数据风险“逐个击破”

导读 解决医疗机构“临床业务数据合规流动”与“重要数据安全防护”两大难题。 2023年11月11日&#xff0c;在2023年南湖HIT论坛上&#xff0c;HIT专家网联合杭州美创科技股份有限公司&#xff08;以下简称美创科技&#xff09;发布《医疗数据安全风险分析及防范实践》白皮书…

完成python+neo4j+django踩坑记录

使用Django进行后端控制&#xff0c;Echarts进行前端显示 例子django安装1、django启动2、django初体验3、django踩坑【已解决】You have 18 unapplied migration(s). Your project may not work properly until you apply the migra【已解决】运行neo4j出现报错 Failed to sta…

回车事件怎样绑定?

首先要记住一点&#xff0c;回车事件只能在js代码中绑定&#xff0c;在HTML中绑定是获取不到的&#xff0c;下面是我自己写的一个示例&#xff0c;大家可以参考一下。 importt.onkeydown function(event) {let val document.getElementById(importt).value;let e event || …

目标检测COCO数据集与评价体系mAP

1.mAP 2.IoU IoU也就是交并比&#xff0c;也称为 Jaccard 指数&#xff0c;用于计算真实边界框与预测边界框之间的重叠程度。它是真值框与预测边界框的交集和并集之间的比值。Ground Truth边界框是测试集中手工标记的边界框&#xff0c;用于指定目标图像的位置以及预测的边界框…