Redis常见问题排查与解决方案指南

Redis作为高性能的内存数据库，广泛应用于缓存、队列、实时统计等场景。但在实际使用中，开发者和运维人员常会遇到性能下降、内存溢出、主从同步失败等问题。本文将针对高频问题进行详细分析，并提供对应的解决方案和预防措施，助你快速定位并解决Redis疑难杂症。

现象：

原因分析：

解决方案：

设置内存淘汰策略：

# 修改redis.conf，设置最大内存及淘汰策略（推荐allkeys-lru或volatile-lru）
maxmemory 4gb
maxmemory-policy allkeys-lru

预防措施：

现象：

原因分析：

解决方案：

预防措施：

现象：

1.从节点状态为 wait_bgsave 或 reconnecting。

2.info replication 显示 master_link_status:down。

原因分析：

3.主从网络不通或端口未开放。

4.主节点持久化时内存不足，导致bgsave失败。

5.从节点写入（未设置 read-only）。

解决方案：

排查慢查询：

# 查看最近慢查询日志
SLOWLOG GET 10
# 设置慢查询阈值（单位：微秒）
CONFIG SET slowlog-log-slower-than 1000

异步持久化：
- 主节点关闭持久化，由从节点执行bgsave。
- 使用AOF时，选择appendfsync everysec（平衡性能与安全）。
优化网络：
- 使用连接池，避免频繁创建连接。
- 分片集群减少单节点压力。
避免使用KEYS，改用SCAN分页遍历。
监控 instantaneous_ops_per_sec 和 connected_clients，合理配置tcp-backlog。

检查主从连接：

# 在从节点执行，查看复制状态
REPLICAOF 主节点IP 端口
INFO replication

修复数据不一致：

# 主节点计算键差异
redis-cli -h 主节点 info keyspace
# 从节点执行校验
redis-cli --eval check_replica.lua

预防措施：

场景与解决方案：

问题	现象	解决方案
缓存击穿	热点Key过期后，大量请求击穿到DB	1. 互斥锁（Redis SETNX） 2. 永不过期，逻辑过期时间更新
缓存穿透	大量查询不存在的数据	1. 布隆过滤器拦截 2. 空值缓存（SET null 300）
缓存雪崩	大量Key同时过期，DB压力激增	1. 随机过期时间 2. 集群分片 3. 熔断降级（如Hystrix）

排查步骤：

查看当前连接数：

redis-cli info clients  # connected_clients

分析连接来源：

redis-cli client list | awk '{print $2}' | cut -d= -f2 | sort | uniq -c

释放空闲连接：

# 设置超时时间（秒）
CONFIG SET timeout 60

RDB与AOF选择建议：

# 先加载AOF，再加载RDB（若AOF启用）
redis-server --appendonly yes --dbfilename dump.rdb

必备监控项：
- 内存使用率、连接数、延迟、命中率（keyspace_hits/(keyspace_hits+keyspace_misses)）。
- 推荐工具：RedisInsight、Prometheus + Grafana。
运维建议：
- 生产环境至少部署一主一从+哨兵。
- 避免单机多实例时开启Swap。
- 定期执行 redis-check-aof 和 redis-check-rdb 检测持久化文件完整性。