告警解释
当集群中的CN实例或者DN实例执行归档命令归档XLOG日志失败时,产生该告警。
在下次执行成功时告警自动恢复。
告警属性
告警ID | 告警级别 | 可自动清除 |
---|---|---|
37016 | 严重 | 是 |
告警参数
参数名称 | 参数含义 |
---|---|
ServiceName | 产生告警的服务名称 |
RoleName | 产生告警的角色名称 |
HostName | 产生告警的主机名 |
Instance | 产生告警的实例 |
对系统的影响
可能会导致部分XLOG日志未被归档到归档命令指定的归档目录。XLOG日志目录中的XLOG日志文件数会一直增长,导致磁盘空间不足。
可能原因
- 归档命令错误。
- 归档命令指定的归档目录没有写入权限。
- 归档命令指定的归档目录不存在。
- 归档命令指定的归档目录空间满,已无法写入。
处理步骤
修改归档配置。
- 登录FusionInsight Manager界面,单击“告警管理”,在告警列表中点击对应告警,从“告警详情”中的“定位信息”获取告警所在节点和实例的信息。
- 使用PuTTY工具以root用户或者omm用户登录发生告警的节点。
- 检查告警对应Coordinator实例或Datanode主实例的“postgresql.conf”文件(例如“/srv/BigData/mppdb/data1/master1/postgresql.conf”)中的归档命令archive_command语法是否错误。
- 是,执行4。
- 否,执行5。
- 将命令修改正确,等待5分钟,查看告警是否重现。
命令详情可参考“postgresql.conf”中的注解。
- 是,执行5。
- 否,处理完毕。
- 检查归档命令所指定的归档目录是否存在以下问题:不存在、没有写入权限或者空间已满。
- 是,执行6。
- 否,执行7。
- 根据检查结果修复对应问题,确保指定的归档目录可以正确写入。等待5分钟,查看告警是否重现。
- 是,执行7。
- 否,处理完毕。
收集故障信息。