常用的分布式缓存Redis单机并发量能达到万级,常用的关系型数据库MySQL一般并发量是千级,他们支持的并发量可能差十倍,所以要尽可能把流量拦截在缓存层。
缓存击穿
一个并发访问量比较大的key在某个时间过期,导致所有的请求直接打在DB上。这就叫缓存击穿,这会增大数据库的负载。
如何解决缓存击穿?
1、加锁更新:查询缓存,发现缓存中不存在,加锁,让其他线程等待,只让一个线程去更新缓存
2、异步更新:把缓存设置成永不过期,后台设置一个守护线程定时更新缓存,但这种定时比较难以把控。此机制更适合用于缓存预热
缓存穿透
缓存穿透指的是查询缓存和数据库中都不存在的数据,这样每次请求就会直接打到数据库上,相当于缓存不存在了,缓存失去了保护后端存储的意义。缓存穿透可能会使得后端存储负载加大,如果发现大量存储层空命中,可能就是出现了缓存穿透问题。
缓存穿透可能有两种原因:
1、自身业务代码问题
2、恶意攻击,爬虫造成空命中
如何解决缓存穿透?
1、缓存空值/默认值
在数据库不命中之后,把一个空对象或者默认值保存到缓存,之后再访问这个数据,就会从缓存中获取,这样就保护了数据库
缓存空值会有两个问题:
1、空值做缓存,意味着缓存层存了更多的key,需要更多的内存空间。比较有效的方法时针对这类数据设置一个较短的过期时间,让其自动剔除
2、缓存层和存储层的数据都会有一段时间窗口不一致,可能会对业务有一定影响,如果过期时间设置为5分钟,如果此时存储层添加了这个数据,那么此段时间就会出现缓存曾和存储层数据不一致。
此时可以利用消息队列或者其他异步方式清理缓存中的空对象
2、布隆过滤器
可以再存储和缓存之前加一个布隆过滤器,做一层过滤。
布隆过滤器优点类似于哈希表,它是一个连续的数据结构,每个存储位都是一个bit,用0或1来标识数据是否存在。存储数据的时候,使用K个不同的哈希函数将这个变量映射到bit列表的K个点,把它们置1。
我们判断缓存key是否存在的时候,同样使用K个对应的哈希函数,映射到bit列表上的K个点,判断是不是1。
如果不是全1,那么说明key不存在。如果都是1,说明key可能存在(因为哈希函数是存在碰撞的)。
总结以下缓存穿透解决方案:
ey不存在。如果都是1,说明key可能存在(因为哈希函数是存在碰撞的)。
总结以下缓存穿透解决方案:
解决缓存传统 | 适用场景 | 维护成本 |
---|---|---|
缓存空对象 | 数据命中不高;数据频繁实时性高 | 代码维护简单;需要较多的缓存空间;数据不一致 |
布隆过滤器 | 数据命中不高;数据相对固定,实时性低 | 代码维护复杂;缓存空间占用少 |
缓存雪崩
指的是在某一时刻发生大规模的缓存失效的情况,例如缓存服务器宕机、大量key在同一时间过期,这样的后果就是大量的请求进来直接打在数据库上,可能导致整个系统崩溃,称为雪崩。
缓存雪崩式问题该如何预防和处理?
1、提高缓存可用性
- 集群部署:通过集群提升缓存的可用性,利用redis本身的redis cluster或者第三方集群方案
- 多级缓存:设置多级缓存,第一季缓存失效的基础上,访问二级缓存,每一级缓存的失效时间都不一样
2、合理设置过期时间
- 均匀过期:为了避免大量的缓存在同一时间过期,可以把不同的key过期时间随机生成,避免时间太过集中
- 热点数据永不过期
3、熔断降级
- 服务熔断:当缓存服务器宕机或者超时响应时,为了防止整个系统出现雪崩,暂时停止业务服务访问缓存系统
- 服务降级:当出现大量缓存失效,而且处在高并发高负荷的情况下,在业务系统内部暂时舍弃对一些非核心的接口和数据的请求,而是直接返回一个提前准备好的fallback错误处理信息