目录
一、redis的三大缓存问题
1、缓存穿透
1.1 问题描述
1.2缓存穿透发生的条件
1.3缓存穿透发生的原因
1.4解决方案
2、缓存雪崩
2.1问题描述
2.2解决缓存雪崩问题的方法有:
3、缓存击穿 (热点数据集中失效)
3.1问题描述
3.2缓存击穿的现象
3.3缓存击穿发生的原因
3.4解决方案
一、redis的三大缓存问题
正常情况下,大部分的访问请求应该是先被redis响应的,在redis那里得不到响应的小部分访问请求才会去请求MySQL数据库获取数据,这样MySQL数据库的负载压力是非常小的,且可以正常工作
缓存雪崩/穿透/击穿三大问题的根本原因在于redis缓存命中率下降,大量请求会直接发送给MySQL数据库,导致MySQL数据库压力过大而崩溃。
redis的三大缓存问题:
缓存雪崩:redis中大量缓存key集体过期
缓存穿透:大量请求访问redis和MySQL都不存在的资源
缓存击穿:redis中一个热点key过期,此时又有大量用户访问这个热点key(redis-cli --hotkeys 可用于查找热Key)
在大多数互联网应用中,缓存的使用方式如下图所示:
1、缓存穿透
缓存穿透是指缓存和数据库中都没有的数据,而用户不断发起请求,导致请求直接落到数据库上。
业务系统要查询的数据根本就存在!当业务系统发起查询时,按照上述流程,首先会前往缓存中查询,由于缓存中不存在,然后再前往数据库中查询。
由于该数据压根就不存在,因此数据库也返回空。这就是缓存穿透。
综上所述:业务系统访问压根就不存在的数据,就称为缓存穿透
1.1 问题描述
key 对应的数据在数据源并不存在,每次针对此 key 的请求从缓存获取不到,请求都会压到数据源(数据库),从而可能压垮数据源。比如用一个不存在的用户 id 获取用户信息,不论缓存还是数据库都没有,若黑客利用此漏洞进行攻击可能压垮数据库。
(你要知道,目前业务系统中最脆弱的就是IO,稍微来点压力它就会崩溃,所以我们要想种种办法保护它)
1.2缓存穿透发生的条件
应用服务器压力变大
redis 命中率降低
一直查询数据库,使得数据库压力太大而压垮
其实 redis 在这个过程中一直平稳运行,崩溃的是我们的数据库(如 MySQL)。
1.3缓存穿透发生的原因
黑客或者其他非正常用户频繁进行很多非正常的 url 访问,使得 redis 查询不到数据库。
发生缓存穿透的原因有很多,一般为如下两种:
- 恶意攻击,故意营造大量不存在的数据请求我们的服务,由于缓存中并不存在这些数据,因此海量请求均落在数据库中,从而可能会导致数据库崩溃。
- 代码逻辑错误。这是程序员的锅,没啥好讲的,开发中一定要避免!
1.4解决方案
- 对空值缓存:如果一个查询返回的数据为空(不管是数据是否不存在),我们仍然把这个空结果(null)进行缓存,设置空结果的过期时间会很短,最长不超过五分钟。
- 设置可访问的名单(白名单):使用 bitmaps 类型定义一个可以访问的名单,名单 id 作为 bitmaps 的偏移量,每次访问和 bitmap 里面的 id 进行比较,如果访问 id 不在 bitmaps 里面,进行拦截,不允许访问。
- 采用布隆过滤器:布隆过滤器(Bloom Filter)是 1970 年由布隆提出的。它实际上是一个很长的二进制向量 (位图) 和一系列随机映射函数(哈希函数)。布隆过滤器可以用于检索一个元素是否在一个集合中。它的优点是空间效率和查询时间都远远超过一般的算法,缺点是有一定的误识别率和删除困难。
- 进行实时监控:当发现 Redis 的命中率开始急速降低,需要排查访问对象和访问的数据,和运维人员配合,可以设置黑名单限制服务
布隆过滤器图:
缓存穿透的解决方案:
- 对空值也进行缓存
- 使用布隆过滤器进行判断拦截一定不存在的无效请求
- 使用脚本实时监控,进行黑名单限制
2、缓存雪崩
缓存雪崩是指缓存中的大量数据同时失效或过期,导致请求直接击穿到数据库,导致数据库压力过大而崩溃。
缓存雪崩指在一个高并发的系统中,由于大量的缓存数据在同一时间段内过期或失效,导致大量请求无法从缓存中获取数据,因此大量并发请求可能导致数据库服务器过载,甚至宕机,从而引发整个系统崩溃。
当缓存失效以后却是这样的:
缓存其实扮演了一个保护数据库的角色。
它帮数据库抵挡大量的查询请求,从而避免脆弱的数据库受到伤害。
如果缓存因某种原因发生了宕机,那么原本被缓存抵挡的海量查询请求就一起一窝蜂的一样涌向数据库。此时数据库如果抵挡不了这巨大的压力,它就会崩溃。
这就是缓存雪崩。
2.1问题描述
key 对应的数据存在,但在 redis 中过期,此时若有大量并发请求过来,这些请求发现缓存过期一般都会从后端数据库加载数据并回设到缓存,这个时候大并发的请求可能会瞬间把后端数据库压垮。
缓存雪崩与缓存击穿的区别在于这里针对很多 key 缓存,前者则是某一个 key 正常访问。
2.2解决缓存雪崩问题的方法有:
- 构建多级缓存架构:nginx 缓存 + redis 缓存 + 其他缓存(ehcache 等)。
- 使用锁或队列:用加锁或者队列的方式来保证不会有大量的线程对数据库一次性进行读写,从而避免失效时大量的并发请求落到底层存储系统上,该方法不适用高并发情况。
- 设置过期标志更新缓存:记录缓存数据是否过期(设置提前量),如果过期会触发通知另外的线程在后台去更新实际 key 的缓存。
- 将缓存失效时间分散开:比如可以在原有的失效时间基础上增加一个随机值,比如 1-5 分钟随机,这样每一个缓存的过期时间的重复率就会降低,就很难引发集体失效的事件。
- 设置缓存失效时间时,可以采用随机时间,避免大量缓存在同一时间失效。
- 使用分布式缓存,将缓存分散在多台服务器上,当某台服务器出现问题时,仍有其他服务器提供缓存服务。
- 使用热点数据永远不过期策略,将热点数据的失效时间设置为永不过期或设置合理的过期时间。
缓存雪崩的解决方案:
- 使用随机数设置key的过期时间,防止集体过期
- 设置缓存标记,如果缓存过期,则自动更新缓存
- 数据库使用排他锁,实现加锁等待
3、缓存击穿 (热点数据集中失效)
3.1问题描述
key 对应的数据存在,但在 redis 中过期,此时若有大量并发请求过来,这些请求发现缓存过期一般都会从后端数据库加载数据并回设到缓存,这个时候大并发的请求可能会瞬间把后端数据库压垮
3.2缓存击穿的现象
数据库访问压力瞬时增加,数据库崩溃
redis 里面没有出现大量 key 过期
redis 正常运行
3.3缓存击穿发生的原因
redis 某个 key 过期了,大量访问使用这个 key(热门 key)。
3.4解决方案
key 可能会在某些时间点被超高并发地访问,是一种非常 “热点” 的数据。
- 预先设置热门数据:在 redis 高峰访问之前,把一些热门数据提前存入到 redis 里面,加大这些热门数据 key 的时长。
- 实时调整:现场监控哪些数据热门,实时调整 key 的过期时长。
- 使用锁:就是在缓存失效的时候(判断拿出来的值为空),不是立即去 load db。先使用缓存工具的某些带成功操作返回值的操作(比如 Redis 的 SETNX)去 set 一个 mutex key。当操作返回成功时,再进行 load db 的操作,并回设缓存,最后删除 mutex key;当操作返回失败,证明有线程在 load db,当前线程睡眠一段时间再重试整个 get 缓存的方法。
缓存击穿的解决方案:
- 预先对热点数据进行缓存预热
- 监控数据,实时调整过期时长
- 数据库使用排他锁,实现加锁等待
缓存问题 | 产生原因 | 解决方案 |
缓存穿透 | 查询不存在的数据,导致数据库过载 | 1. 布隆过滤器 2. 空值缓存 |
缓存雪崩 | 大量缓存失效,导致数据库过载 | 1. 分散缓存失效时间 2. 多级缓存 3. 缓存高可用 4. 服务降级限流 |
缓存击穿 | 热点数据失效,导致数据库过载 | 1. 热点数据永不过期 3、预先对热点数据进行缓存预热 |
穿透
指的是针对不存在于缓存中的数据进行大量请求,导致这些请求直接访问数据库。这可能是因为恶意请求或者查询不存在的键导致的。
击穿
发生在某个热点数据过期后,此时有大量并发请求同时访问该热点数据,导致大量请求直接访问数据库。
雪崩
指的是缓存中大量的数据同时失效,导致大量请求直接访问数据库,造成数据库负载剧增