大数据之LibrA数据库系统告警处理(ALM-12012 NTP服务异常)

告警解释

当节点NTP服务无法与主OMS节点NTP服务正常同步时间时产生该告警。

当节点NTP服务与主OMS节点NTP服务正常同步时间时恢复该告警。

告警属性

告警ID

告警级别

可自动清除

12012

严重

告警参数

参数名称

参数含义

ServiceName

产生告警的服务名称。

RoleName

产生告警的角色名称。

HostName

产生告警的主机名。

对系统的影响

该节点的时间与集群其它节点的时间不同步,可能会导致该节点上的某些FusionInsight应用无法正常运行。

可能原因
  • 该节点的NTP服务无法正常启动。
  • 该节点与主OMS节点NTP服务不能正常同步时间。
  • 该节点NTP认证的key值与主OMS节点NTP服务的key值不一致。
  • 该节点与主OMS节点NTP服务时间偏差太大。
处理步骤

检查该节点的NTP服务是否正常启动。

  1. 检查ntpd进程是否运行在告警节点上。使用root用户登录告警节点,执行命令:ps -ef | grep ntpd | grep -v grep,检查命令是否输出ntpd进程的信息。

    • 是,执行步骤 4。
    • 否,执行步骤 2。

  2. 执行service ntp start(RedHat系统执行service ntpd start)启动NTP服务。
  3. 10分钟后,检查该告警是否恢复。

    • 是,处理完毕。
    • 否,执行步骤 4。

检查该节点与主OMS节点NTP服务是否正常同步时间。

  1. 查看NTP告警的“附加信息”是否描述“与主OMS节点NTP服务无法同步时间”(“Can not synchronize time with active OMS server”)。

    • 是,执行步骤 5。
    • 否,执行步骤 14。

  2. 排查与主OMS节点NTP服务的同步是否有问题。

    使用root用户登录告警节点,执行ntpq -np命令。

    如果显示结果的主OMS节点NTP服务IP地址前有“*”号,表示同步正常,如下:

    remote refid st t when poll reach delay offset jitter 
    ============================================================================== 
    *10.10.10.162 .LOCL. 1 u 1 16 377 0.270 -1.562 0.014

    如果显示结果的主OMS节点NTP服务IP前无“*”号,且“refid”项内容为“.INIT.”,表示同步不正常。

    remote refid st t when poll reach delay offset jitter 
    ============================================================================== 
    10.10.10.162 .INIT. 1 u 1 16 377 0.270 -1.562 0.014
    • 是,执行步骤 6。
    • 否,执行步骤 17。

  3. NTP不能正常同步,通常与系统防火墙有关。如果能关闭防火墙,建议尝试关闭防火墙;如果不能关闭防火墙,请检查防火墙配置策略,确保UDP 123端口未禁用(具体遵循各系统下防火墙配置策略)。
  4. 处理防火墙后等待10分钟,检查该告警是否恢复。

    • 是,处理完毕。
    • 否,执行步骤 8。

  1. 使用root用户登录主OMS节点,执行下列命令,查看key值索引号为“1M”的认证码。

    SUSE系统执行:cat /opt/huawei/Bigdata/om-server/OMSV100R001C00x8664/workspace/conf/ntp.keys

    RedHat系统执行:cat /opt/huawei/Bigdata/om-server/OMSV100R001C00x8664/workspace/conf/ntpkeys

  2. 执行下列命令,查看key值是否与步骤 8的查询值相同。

    SUSE系统执行:diff /opt/huawei/Bigdata/om-server/OMSV100R001C00x8664/workspace/conf/ntp.keys /etc/ntp.keys

    RedHat系统执行:diff /opt/huawei/Bigdata/om-server/OMSV100R001C00x8664/workspace/conf/ntpkeys /etc/ntp/ntpkeys

    • 是,执行步骤 10。
    • 否,执行步骤 17。

  3. 执行cat ${BIGDATA_HOME}/om-server/om/packaged-distributables/ntpKeyFile,查看key值是否与步骤 8的查询值相同。(请与步骤 8查询值的认证秘钥索引为“1M”的key值进行对比)。

    • 是,执行步骤 17。
    • 否,执行步骤 11。

  4. 使用root用户登录故障节点,SUSE系统执行cat /etc/ntp.keys(RedHat系统执行cat /etc/ntp/ntpkeys),查看key值是否与步骤 10的查询值相同(请使用查询出的认证秘钥索引为“1M”的key值进行对比)。

    • 是,执行步骤 17。
    • 否,执行步骤 12。

  5. 使用root用户或omm用户执行以下命令,修改主OMS节点ntp的key值(RedHat系统请将ntp.keys改为ntpkeys)。

    cd ${BIGDATA_HOME}/om-server/OMSV100R001C00x8664/workspace/conf

    sed -i "`cat ntp.keys | grep -n '1 M'|awk -F ':' '{print $1}'`d" ntp.keys

    echo "1 M `cat ${BIGDATA_HOME}/om-server/om/packaged-distributables/ntpKeyFile`" >>ntp.keys

    查看“ntp.keys”中认证秘钥索引字段为1M的key值是否和ntpKeyFile的值相同

    • 是,执行步骤 13。
    • 否,请尝试手动将ntp.keys中认证秘钥索引字段为1M的key值修改为ntpKeyFile的key值。

  6. 5分钟后,使用root用户执行以下命令,查看系统配置文件是否已经同步。

    RedHat系统执行:diff /etc/ntp/ntpkeys ${BIGDATA_HOME}/om-server/OMSV100R001C00x8664/workspace/conf/ntpkeys

    SUSE系统执行:diff /etc/ntp.keys ${BIGDATA_HOME}/om-server/OMSV100R001C00x8664/workspace/conf/ntp.keys

    执行命令无返回结果即为已经同步,同步成功后,执行命令service ntp restart,重启主OMS节点ntp服务,15分钟后查看告警是否消除。

    • 是,处理完毕。
    • 否,执行步骤 17。

检查该节点与主OMS节点NTP服务时间偏差是否太大。

  1. NTP告警的“附加信息”是否描述“时间偏差太大”(time offset)。

    • 是,执行步骤 15。
    • 否,执行步骤 17。

  2. 在“主机管理”页面,勾选告警节点的主机,选择“更多操作 > 停止所有角色”停止告警节点的所有服务。

    如果告警节点时间比主OMS节点NTP服务时间慢,校正告警节点的系统时间。校正告警节点的系统时间后,选择“更多操作 > 启动所有角色”启动告警节点的服务。

    如果告警节点时间比主OMS节点NTP服务时间快,等待相应时间差,校正告警节点的系统时间。校正完成后,选择“更多操作 > 启动所有角色”启动告警节点的服务。

    说明:

    如果不做相应等待,可能造成数据丢失风险。

  3. 10分钟后,检查该告警是否恢复。

    • 是,处理完毕。
    • 否,执行步骤 17。

收集故障信息。

  1. 在FusionInsight Manager界面,单击“系统设置 > 日志下载”。
  2. 在“服务”下拉框中勾选“NodeAgent”、“OmmServer”,设置“主机”为告警所在节点和主OMS节点,单击“确定”。
  3. 设置日志收集的“开始时间”和“结束时间”分别为告警产生时间的前后30分钟,单击“下载”。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/128787.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

分布式多主关系数据库的底线业务优势

当今的应用程序(包括企业应用程序)需要始终开启且始终可用,并且通常必须为全球用户提供服务,这些用户无论身在何处都希望获得几乎即时的响应时间。 应对这些挑战不仅仅意味着让用户更满意:每个能够解决低延迟和超高可…

唇形驱动媲美头部厂商,青否数字人SaaS系统6.0重磅发布!

青否数字人SaaS系统6.0重磅发布!唇形驱动效果及清晰度媲美硅基等头部厂商,同时优化数字人短视频模块。 唇形驱动媲美头部 青否数字人SaaS系统6.0版本重点优化了唇形驱动,AI技术已经实现与真人形象的1:1克隆,唇形、牙齿和舌头高清…

当科技遇上神器:用Streamlit定制AI可视化问答界面

Streamlit是一个开源的Python库,利用Streamlit可以快速构建机器学习应用的用户界面。 本文主要探讨如何使用Streamlit构建大模型外部知识检索的AI问答可视化界面。 我们先构建了外部知识检索接口,然后让大模型根据检索返回的结果作为上下文来回答问题。…

【AUTOSAR】【以太网】DoIp

AUTOSAR专栏——总目录_嵌入式知行合一的博客-CSDN博客文章浏览阅读217次。本文主要汇总该专栏文章,以方便各位读者阅读。https://xianfan.blog.csdn.net/article/details/132072415 目录 一、概述 二、功能描述 2.1 Do

DNS 域名解析协议

作用 将域名转化位IP地址 域名 用’ . ’ 隔开的字符串,如:www.badu.com,就是为了赋予IP特殊含义。 一级域名 .com :公用 .cn:中国 .gov:政府 .us:美国 .org:组织 .net:网站 对应一级…

HTML脚本、字符实体、URL

HTML脚本&#xff1a; JavaScript 使 HTML 页面具有更强的动态和交互性。 <script> 标签用于定义客户端脚本&#xff0c;比如 JavaScript。<script> 元素既可包含脚本语句&#xff0c;也可通过 src 属性指向外部脚本文件。 JavaScript 最常用于图片操作、表单验…

Doris常用语句

SWITCH mysql_report; SWITCH mysql_floweda; SWITCH mysql_base; SWITCH internal;select * from mysql_floweda.flow_eda.eda_flow;select * from mysql_report.cz_report.etl_flow; select * from mysql_report.cz_report.etl_flow_log;#外部数据物化视图 create materi…

Vue路由导航(replace、push、forward、back、go)

Vue路由导航&#xff08;replace、push、forward、back、go&#xff09; 先了解栈结构&#xff0c;再学习以下内容 栈的数据结构&#xff1a;先进后出&#xff0c;后进先出。原理&#xff1a;push将元素压入栈内&#xff0c;pop将元素弹出&#xff0c;栈有分别有栈底指针和栈顶…

C++11 initializer_list 轻量级初始化列表的使用场景(让自定义类可以用初始化列表的形式来实例化对象)

initializer_list 是 C11 中的一个特性&#xff0c;它允许你使用花括号 {} 中的值列表来初始化容器或数组。通常用于初始化标准库容器&#xff0c;比如 std::vector、std::set、std::map 以及数组。 场景一&#xff1a;用初始化列表初始化容器 std::vector<int> arr {…

Java中Deque栈对象的增删查(所有方法详解)

1、Deque栈的增删查方法总结 2、方法增删查 栈顶添加&#xff1a;push、offFirst栈尾添加&#xff1a;add、offer、offerLast栈顶删除&#xff1a;remove、pop、poll、pollFirst栈尾删除&#xff1a;pollLast栈顶查看&#xff1a;peek、peekFirst栈尾查看&#xff1a;peekLast…

搭载基于RK3229的Android5.1修改开机默认桌面Launcher

1、找到ActivityManagerService.java 在..\rk3229_5.1_box\frameworks\base\services\core\java\com\android\server\am目录找到ActivityManagerService.java文件。在文件里找到startHomeActivityLocked函数里的setDefaultLauncher。 boolean startHomeActivityLocked(int use…

WebService客户端几种实现方式

客户端几种实现方式&#xff08;转载&#xff09; Demo-HttpClient public static void main(String[] args) throws Exception {//soap服务地址String url "http://10.104.168.38:6906/sip/services/XJSSServices?wsdl";StringBuilder soapBuilder new StringBu…

软件设计模式原则(一)迪米特法则

开一个小专题——详细总结一下软件设计模式原则&#xff0c;这部分在《软计》和《java设计模式》中算是很重要的知识点&#xff0c;值得展开详细讲解一下~首先介绍的是【迪米特法则】 一.定义 迪米特法则又称为最少知识原则&#xff0c;其定义为&#xff1a;一个软件实体应当尽…

微众银行备用金怎么取出来

在这个数字时代里&#xff0c;互联网金融产品以其便捷性和创新性逐渐成为我们日常生活中不可或缺的一部分。微众银行作为国内领先的互联网银行&#xff0c;其旗下的微众备用金产品凭借其灵活、便捷的特性&#xff0c;深受消费者喜爱。那么&#xff0c;微众备用金怎么借钱出来呢…

JavaScript中BOM与DOM

BOM window对象 所有的浏览器都支持window对象&#xff0c;他表示浏览器窗口&#xff0c; 所有 JavaScript 全局对象、函数以及变量均自动成为 window 对象的成员。 全局变量是 window 对象的属性。全局函数是 window 对象的方法。 接下来要讲的HTML DOM 的 document 也是…

【设计模式】第24节:行为型模式之“模板方法模式”

一、简介 模板方法模式在一个方法中定义一个算法骨架&#xff0c;并将某些步骤推迟到子类中实现。模板方法模式可以让子类在不改变算法整体结构的情况下&#xff0c;重新定义算法中的某些步骤。 模板模式有两大作用&#xff1a;复用和扩展。其中&#xff0c;复用指的是&#…

Tailwind CSS vs 现代CSS,Tailwind CSS 会像CSS-in-JS 一样亡?

本文是 关于Tailwind CSS 与 现代 CSS之间比较的文章。文章中作者详细比较了这两种CSS开发方法的优缺点。他指出&#xff0c;Tailwind CSS是一种基于类的CSS框架&#xff0c;提供了快速开发网站的便利性&#xff0c;但可能导致HTML代码的臃肿。另一方面&#xff0c;现代CSS方法…

蓝桥杯每日一题2023.10.31

题目描述 全球变暖 - 蓝桥云课 (lanqiao.cn) 题目分析 果然有关连通块类的问题使用dfs都较为好写~~ 我们可以通过判断连通块的代码来加上部分条件算出被完全淹没的岛屿个数 在岛屿中如果有为"#"的a[i][j]上下左右全部是"#"则说明此岛屿一定不会被完全…

C++中空间搜索树rtree的使用

目录 1 基础使用 1 基础使用 &#xff08;一&#xff09;头文件 #include "mapmatch/r_tree.h" &#xff08;二&#xff09;创建rtree had::RTree<SDDBLink*, double, 2> _sdlink_geo_tree; //声明rtree //创建rtree for (auto iter_sdlink : map_sd_link) …

SQL Server 中定时调度调用存储过程

要在SQL中定时调度调用存储过程&#xff0c;你可以使用SQL Server代理&#xff08;如果你正在使用SQL Server数据库&#xff09;。下面是一些步骤来配置SQL Server代理以定时调度调用存储过程&#xff1a; 打开SQL Server Management Studio (SSMS) 并连接到你的SQL Server实例…