告警解释
当DN主实例有未同步到DN备实例的xlog日志被删除时,产生该告警。
告警属性
告警ID | 告警级别 | 可自动清除 |
---|---|---|
37001 | 严重 | 是 |
告警参数
参数名称 | 参数含义 |
---|---|
ServiceName | 产生告警的服务名称 |
RoleName | 产生告警的角色名称 |
HostName | 产生告警的主机名 |
Instance | 产生告警的实例 |
对系统的影响
DN主实例pg_xlog目录中的xlog文件被删除后,与之对应的DN备实例将无法从DN主实例上同步xlog日志。此时将触发对备机的重建,重建会增加备机物理节点的网络压力。如果丢失的日志是DN主实例正在使用的xlog日志,则会造成部分数据丢失,导致DN主实例异常。
可能原因
- 当DN主实例正在写事务时,其中pg_xlog目录下的xlog文件被删除。
- 当DN备实例进程异常,而对应的DN主实例在这段时间内存在写事务,该DN主实例的pg_xlog目录中的xlog文件被删除。
处理步骤
- 集群会自动触发对备机的重建,并在重建成功后集群自动恢复告警。
- 若长时间没有恢复,重启节点。