国家电网某地电力公司网络硬件综合监控运维项目

        国家电网某地电力公司是国家电网有限公司的子公司,负责当地电网规划、建设、运营和供电服务,下属多家地市供电企业和检修公司、信息通信公司等业务支撑实施机构。

项目现状

        随着公司信息化建设加速,其信息内网中存在大量物理服务器、存储设备、光纤交换机等设备,缺少监控设备细颗粒度部件状态的运维工具,无法满足实际运维需求。

设备类型:存储设备、服务器、光纤交换机、交换机等

设备品牌:华为、H3C、浪潮、惠普、IBM、中兴、联想、DELL、曙光、南瑞、神州鲲泰、超聚变、沃趣、长城超云、Brocade、MELLANOX、贝尔、锐捷等

设备数量:2000+台

项目期望:

  • 将网络内近200种不同品牌、不同型号、不同类型的设备统一、集中监控;
  • 提供详细的、粒度细设备监控指标库,支持监控的指标包括但不限于:CPU、内存、磁盘、网口、温度等;
  • 能够实时监控设备的运行数据,快速判断出硬件部件故障位置与级别,提供高效的故障排查和处理手段;
  • 解决设备产生的事件和日志信息格式多样、复杂不一致的问题,可以对其进行集中管理,并转化为清晰易于理解的告警信息;
  • 具有多种可供选择的告警通知方式,包括但不限于邮件、短信、微信等;
  • 解决目前主要依赖人工巡检,造成的巡检频度低,人力耗费大的问题;
  • 解决不同类型设备配置复杂和设备配置工作量大的问题,能够对设备的配置文件进行管理;
  • 能够与SG-I6000设备状态评价模块进行对接。

智和信通方案

        经过与用户一线运维工程师的深入交流,智和信通充分明确了其对监控运维平台的核心需求,并通过对其日常运维工作的分析提供出针对性的解决方案。

海量异构设备统一纳管

        内置大量不同类型、不同品牌型号设备监控模型,通过多维度监控设备,获取网络最新运行状态。监控指标涵盖在线状态、Ping、CPU、内存、网络接口、磁盘、进程、电源、风扇、温度等各方面。且不同类型和应用场景下的设备具备差异监控资源和监视指标,在设备统一纳管的情况下,实现差异化故障告警。

        提供设备、资源、设备间连接关系自动化发现绘制能力,以图形方式实现设备、资源、链路状态的直观展示,为设备部件故障的实时发现和有效处理提供便利。

灵活可配的设备、资源、监视任务模型库

        支持自定义配置设备类型、设备资源模型和故障监视器、性能监视器监视任务等模型,实现对电力公司内部覆盖存储设备、服务器、光纤交换机、交换机等设备类型,华为、H3C、浪潮、惠普、IBM、中兴、联想、DELL、曙光、南瑞、神州鲲泰、超聚变、沃趣、长城超云、Brocade、MELLANOX、贝尔、锐捷等设备品牌的近200个品牌型号的监控支持。

全面监控设备性能,感知网络运行态势

        全面采集网络内存储、服务器、光纤交换机、交换机等设备的性能信息,按照时间、资源、性能类型等多种维度,图形、表格等多种形式进行实时性能和历史性能的展示。并通过智能算法分析历史数据,对磁盘容量、交换机端口容量、机房机柜容量进行展示和预测分析,并根据容量可使用时间进行自定义预警。

多种告警机制,可自定义告警阈值

        支持多种告警机制,自定义配置告警阈值,从众多的事件、日志和状态信息中分析提炼异常数据并转化为告警。第一时间获取准确的告警信息,快速标示已执行操作的告警,迅速定位告警设备。

智能告警降噪,快速定位故障根因

        采用自动去重、风暴抑制、关联聚合、维护期时间屏蔽、依赖屏蔽等多种智能告警降噪机制,对各类告警进行自动压缩收敛,减少无效告警,一步定位发生故障的源头设备。快速检索异常问题关联涉及的各项维度与影响范围,快速定位问题边界,直达故障根因。

多种告警通知途径结合故障自愈能力,实现快速排障

        通过故障阈值的设置,在故障真正到来前,提前触发通知机制,三级逐步预警。告警发生中,自动关联调取内置的故障处置预案,配合告警自愈及自动派单能力,快速实现排障处置;在故障消失后,系统能自动检测到先前故障,并做自动清除告警处理。

        提供界面颜色、提示声、光效闪烁、信息列表、Email、短信、钉钉、企业微信、个人微信等多种通知渠道。

匹配真实运维场景的自动化巡检

        可自定义巡检策略对设备的运行情况进行统计和报表生成,并可预设时间巡检策略执行时间,进行自动化巡检,可向指定邮箱发送巡检结果报告。通过平台内人工触发或定时触发的方式,将巡检工作托管至平台自动执行,解放人力,实现对设备的定期快速检查。

设备配置文件备份、对比、恢复

        定期自动对设备策略进行巡检备份,可在线查看、下载保留或通过本次执行结果与上次执行结果或基线文件的对比,当配置出现异常时进行自动告警,并可结合故障自愈能力,自动回滚到信任的版本。

全网IT资产统一管理

        提供网络内IT设备一键同步资产数据库的功能,快速同步拓扑内的监控设备,并对其进行资产生命周期管理。以图谱的方式呈现资产与其他资产、配品配件、网络链路、使用人等静态关联关系。

对接I6000系统,实时推送告警与设备状态数据

        方案实现与I6000系统的对接,将设备的异常告警信息集中存储,统一分析处理,转化为I6000可识别的、符合国网要求的标准格式。通过设备信息同步功能,将设备资产、监控信息快速同步至I6000,丰富I6000内关于设备的性能、告警、基本信息等内容。

应用价值

        通过部署智和信通综合监控运维方案,7*24小时实时监控全网设备,获取IT设备的状态信息,真正满足用户硬件资源精细化监控需求。

        通过精细化监控设备的各项硬件指标,实时了解设备的运行状态和负载情况,及时发现硬件组件可能出现的性能瓶颈和故障,不但为设备配置调整和优化提供数据支撑,而且提前预警设备可能出现的故障,以便运维人员有充足的时间准备排障操作。同时,在故障出现后快速诊断故障产生的根本原因,提升排障效率,减少因设备故障带来的业务中断和损失。

        在整体运维工作中通过智和信通综合监控运维方案自动采集、存储、分析设备状态数据,通过设备远程控制和自动化编排运维的能力,对设备进行远程调控和维护,快速提高工作效率的同时,降低IT运维成本,保障电力信息系统稳定、高效运行。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/7577.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Linux动态库与静态库解析

文章目录 一、引言二、C/C源文件的编译过程三、静态库1、静态库的定义和原理2、静态库的优缺点3、静态库的创建和使用a、创建静态库b、使用静态库 四、动态库1、动态库的定义和原理2、动态库的优缺点3、动态库的创建和使用示例a、创建动态库b、使用动态库 五、动静态库的比较 一…

Pytorch学习笔记——神经网络基本框架

一、神经网络是什么 神经网络在人工智能和深度学习的领域,一般称为人工神经网络,即ANN(Artificial Neural Network),是一种模仿人脑神经系统工作方式的计算模型。被广泛应用于人工智能、自动控制、机器人、统计学等领域的信息处理中。 二、…

套管外径测量仪 多尺寸型号 规格全可定制

套管(bushing)是一种将带电导体引入电气设备或穿过墙壁的一种绝缘装置。前者称为电器套管,后者称为穿墙套管。套管通常用在建筑地下室,是用来保护管道或者方便管道安装的铁圈。套管的分类有刚性套管、柔性防水套管、钢管套管及铁皮…

【快速幂取模】

求 a 的 b 次方对 p 取模的值&#xff0c;其中 1≤a,b,p≤109 输入 三个用空格隔开的整数a,b和p。 输出 一个整数&#xff0c;表示ab mod p的值。 样例输入 Copy 2 3 9样例输出 Copy 8 思路&#xff1a; 这里借鉴一下大佬的用例&#xff1a; #include<bits/stdc.h&…

idea提示 CreateProcess error=206, 文件名或扩展名太长有哪些具体的解决方法

背景&#xff1a; 项目启动后提示CreateProcess error206&#xff0c;通常我本地是将shorten command line改成如下就可以解决&#xff0c;但是今天遇到一个&#xff0c;无论这里怎么设置都是启动提示扩展名太长&#xff0c;经过一番处理问题终于解决&#xff0c;特此记录一下。…

面试笔记——垃圾回收

对象被垃圾回收的时机 垃圾回收主要面向的是堆中的对象。简单一句就是&#xff1a;如果一个或多个对象没有任何的引用指向它了&#xff0c;那么这个对象现在就是垃圾&#xff0c;如果定位了垃圾&#xff0c;则有可能会被垃圾回收器回收。 如果要定位什么是垃圾&#xff0c;有两…

分布式锁-快速入门

文章目录 前言一、基础概念1.1 什么是锁1.2 什么是分布式锁1.3 锁和事务的区别二、分布式锁基础理论2.1 为什么要使用分布式锁2.2 分布式锁特性2.3 分布式锁的实现方式总结前言 由于在平时的工作中,线上服务器是分布式多台部署的,经常会面临解决分布式场景下数据一致性的问题…

TRILL解析

Deep Imitation Learning for Humanoid Loco-manipulation through Human Teleoperation解析 摘要1.简介2. Related work2.1 人形机器人的局部操纵2.2 远程操作示范中的模仿学习 3. 方法 论文链接&#xff1a;https://arxiv.org/abs/2309.01952 论文项目&#xff1a;https://ut…

通过mask得到bbox(numpy实现)

在SAM的加持下&#xff0c;我们很容易得到物体的mask&#xff0c;但是物体的bbox信息通常也很有用。那么&#xff0c;我们可以写一个函数&#xff0c;立马可以通过mask得到bbox。 代码如下&#xff1a; import numpy as npdef mask2bbox(mask):nonzero_indices np.nonzero(m…

运维开发工程师教程之MongoDB单机版设置

MongoDB单机版设置 一、创建虚拟机 在VMware Workstation软件中新建一个虚拟机&#xff0c;具体操作步骤如下&#xff1a; ①运行VMware Workstation软件&#xff0c;进入到主界面&#xff0c;单击“创建新的虚拟机”来创建新的虚拟机&#xff0c;如图3-1所示。 图3-1 VMware…

Anaconda安装教程

1Anaconda 简介 Anaconda是一个数据科学平台&#xff0c;提供一个发行版的 Python 以及大量常用的数据科学包、库和工具。通过包含诸如 NumPy、Pandas、SciPy、Matplotlib等核心库&#xff0c;以及 Jupyter Notebook等开发工具&#xff0c;使数据分析、机器学习和数据可视化变…

stm32和树莓派的区别?

在开始前我有一些资料&#xff0c;是我根据网友给的问题精心整理了一份「stm32的资料从专业入门到高级教程」&#xff0c; 点个关注在评论区回复“888”之后私信回复“888”&#xff0c;全部无偿共享给大家&#xff01;&#xff01;&#xff01;Stm32和树莓派是两个不同的领域…

百度副总裁秒批离职,00后的职场逆袭?

“员工闹分手提离职我秒批”&#xff0c;百度副总裁璩静的职场经历和思考在近期引发了大量讨论。 璩静在小红书分享了自己作为女性管理者&#xff0c;面对团队内部的感情问题&#xff0c;是如何处理的&#xff1a; “我第一时间就跟这个年轻的女孩子说&#xff0c;你走吧&…

18、ESP32 ESP-NOW 点对点通信

ESP-NOW 是乐鑫自主研发的无连接通信协议&#xff0c;具有短数据包传输功能。该协议使多个设备能够以简单的方式相互通信。 ESP-NOW 功能 ESP-NOW 支持以下功能&#xff1a; 加密和未加密的单播通信;混合加密和未加密的对等设备;最多可携带 250 字节 的有效载荷;发送回调功能…

【EasySpider】EasySpider+mysql执行配置异常

问题 使用易采集工具操作时候&#xff0c;遇到一个执行异常&#xff0c;后来发现没有选择数据类型 Loading stealth.min.js MySQL config file path: ./mysql_config.json 成功连接到数据库。 Successfully connected to the database. Traceback (most recent call last):…

如何练英语口语?三个简单练习方法

如何练英语口语&#xff1f;在全球化日益加速的今天&#xff0c;英语已经成为了一种必不可少的交流工具。对于很多人来说&#xff0c;尤其是那些想要在国际舞台上崭露头角的人&#xff0c;流利的英语口语更是必不可少的技能。但是&#xff0c;很多人也面临着一个问题&#xff1…

【Flutter】App内购支付集成 Google和Apple支付和服务器验证全流程

Flutter支付集成 前言&#xff1a; 以谷歌内购为例&#xff0c;我们需要做的总共为三步 需要在谷歌市场配置商品&#xff0c;设置测试渠道&#xff0c;配置开发者账号&#xff0c;设置对应权限。配置完商品之后&#xff0c;如何在 Flutter 中获取到商品&#xff0c;购买指定…

Unity技术学习:渲染大量物体的解决方案,外加RenderMesh、RenderMeshInstanced、RenderMeshIndirect的简单使用

叠甲&#xff1a;本人比较菜&#xff0c;如果哪里不对或者有认知不到的地方&#xff0c;欢迎锐评&#xff08;不玻璃心&#xff09;&#xff01; 导师留了个任务&#xff0c;渲染大量的、移动的物体。 寻找解决方案&#xff1a; 当时找了几个解决方案&#xff1a; 静态批处…

面试集中营—JVM篇

一、JVM内存模型 线程独占&#xff1a;栈&#xff0c;本地方法栈&#xff0c;程序计数器; 线程共享&#xff1a;堆&#xff0c;方法区 虚拟机栈&#xff1a;线程私有的&#xff0c;线程执行方法是会创建一个栈阵&#xff0c;用来存储局部变量表&#xff0c;操作栈&#xff0c;…

多个开源的js补环境框架测试

原文链接&#xff1a;https://mp.weixin.qq.com/s/uEMFGpE5bqmTvzSgX2twvA 前言 在做js逆向时肯定会遇到补环境的情况&#xff0c;看到github开源了好几个补环境用的框架&#xff0c;这篇文章做个测试&#xff0c;看看哪个比较好用。 https://github.com/pysunday/sdenvhttp…