国家电网某地电力公司网络硬件综合监控运维项目

        国家电网某地电力公司是国家电网有限公司的子公司,负责当地电网规划、建设、运营和供电服务,下属多家地市供电企业和检修公司、信息通信公司等业务支撑实施机构。

项目现状

        随着公司信息化建设加速,其信息内网中存在大量物理服务器、存储设备、光纤交换机等设备,缺少监控设备细颗粒度部件状态的运维工具,无法满足实际运维需求。

设备类型:存储设备、服务器、光纤交换机、交换机等

设备品牌:华为、H3C、浪潮、惠普、IBM、中兴、联想、DELL、曙光、南瑞、神州鲲泰、超聚变、沃趣、长城超云、Brocade、MELLANOX、贝尔、锐捷等

设备数量:2000+台

项目期望:

  • 将网络内近200种不同品牌、不同型号、不同类型的设备统一、集中监控;
  • 提供详细的、粒度细设备监控指标库,支持监控的指标包括但不限于:CPU、内存、磁盘、网口、温度等;
  • 能够实时监控设备的运行数据,快速判断出硬件部件故障位置与级别,提供高效的故障排查和处理手段;
  • 解决设备产生的事件和日志信息格式多样、复杂不一致的问题,可以对其进行集中管理,并转化为清晰易于理解的告警信息;
  • 具有多种可供选择的告警通知方式,包括但不限于邮件、短信、微信等;
  • 解决目前主要依赖人工巡检,造成的巡检频度低,人力耗费大的问题;
  • 解决不同类型设备配置复杂和设备配置工作量大的问题,能够对设备的配置文件进行管理;
  • 能够与SG-I6000设备状态评价模块进行对接。

智和信通方案

        经过与用户一线运维工程师的深入交流,智和信通充分明确了其对监控运维平台的核心需求,并通过对其日常运维工作的分析提供出针对性的解决方案。

海量异构设备统一纳管

        内置大量不同类型、不同品牌型号设备监控模型,通过多维度监控设备,获取网络最新运行状态。监控指标涵盖在线状态、Ping、CPU、内存、网络接口、磁盘、进程、电源、风扇、温度等各方面。且不同类型和应用场景下的设备具备差异监控资源和监视指标,在设备统一纳管的情况下,实现差异化故障告警。

        提供设备、资源、设备间连接关系自动化发现绘制能力,以图形方式实现设备、资源、链路状态的直观展示,为设备部件故障的实时发现和有效处理提供便利。

灵活可配的设备、资源、监视任务模型库

        支持自定义配置设备类型、设备资源模型和故障监视器、性能监视器监视任务等模型,实现对电力公司内部覆盖存储设备、服务器、光纤交换机、交换机等设备类型,华为、H3C、浪潮、惠普、IBM、中兴、联想、DELL、曙光、南瑞、神州鲲泰、超聚变、沃趣、长城超云、Brocade、MELLANOX、贝尔、锐捷等设备品牌的近200个品牌型号的监控支持。

全面监控设备性能,感知网络运行态势

        全面采集网络内存储、服务器、光纤交换机、交换机等设备的性能信息,按照时间、资源、性能类型等多种维度,图形、表格等多种形式进行实时性能和历史性能的展示。并通过智能算法分析历史数据,对磁盘容量、交换机端口容量、机房机柜容量进行展示和预测分析,并根据容量可使用时间进行自定义预警。

多种告警机制,可自定义告警阈值

        支持多种告警机制,自定义配置告警阈值,从众多的事件、日志和状态信息中分析提炼异常数据并转化为告警。第一时间获取准确的告警信息,快速标示已执行操作的告警,迅速定位告警设备。

智能告警降噪,快速定位故障根因

        采用自动去重、风暴抑制、关联聚合、维护期时间屏蔽、依赖屏蔽等多种智能告警降噪机制,对各类告警进行自动压缩收敛,减少无效告警,一步定位发生故障的源头设备。快速检索异常问题关联涉及的各项维度与影响范围,快速定位问题边界,直达故障根因。

多种告警通知途径结合故障自愈能力,实现快速排障

        通过故障阈值的设置,在故障真正到来前,提前触发通知机制,三级逐步预警。告警发生中,自动关联调取内置的故障处置预案,配合告警自愈及自动派单能力,快速实现排障处置;在故障消失后,系统能自动检测到先前故障,并做自动清除告警处理。

        提供界面颜色、提示声、光效闪烁、信息列表、Email、短信、钉钉、企业微信、个人微信等多种通知渠道。

匹配真实运维场景的自动化巡检

        可自定义巡检策略对设备的运行情况进行统计和报表生成,并可预设时间巡检策略执行时间,进行自动化巡检,可向指定邮箱发送巡检结果报告。通过平台内人工触发或定时触发的方式,将巡检工作托管至平台自动执行,解放人力,实现对设备的定期快速检查。

设备配置文件备份、对比、恢复

        定期自动对设备策略进行巡检备份,可在线查看、下载保留或通过本次执行结果与上次执行结果或基线文件的对比,当配置出现异常时进行自动告警,并可结合故障自愈能力,自动回滚到信任的版本。

全网IT资产统一管理

        提供网络内IT设备一键同步资产数据库的功能,快速同步拓扑内的监控设备,并对其进行资产生命周期管理。以图谱的方式呈现资产与其他资产、配品配件、网络链路、使用人等静态关联关系。

对接I6000系统,实时推送告警与设备状态数据

        方案实现与I6000系统的对接,将设备的异常告警信息集中存储,统一分析处理,转化为I6000可识别的、符合国网要求的标准格式。通过设备信息同步功能,将设备资产、监控信息快速同步至I6000,丰富I6000内关于设备的性能、告警、基本信息等内容。

应用价值

        通过部署智和信通综合监控运维方案,7*24小时实时监控全网设备,获取IT设备的状态信息,真正满足用户硬件资源精细化监控需求。

        通过精细化监控设备的各项硬件指标,实时了解设备的运行状态和负载情况,及时发现硬件组件可能出现的性能瓶颈和故障,不但为设备配置调整和优化提供数据支撑,而且提前预警设备可能出现的故障,以便运维人员有充足的时间准备排障操作。同时,在故障出现后快速诊断故障产生的根本原因,提升排障效率,减少因设备故障带来的业务中断和损失。

        在整体运维工作中通过智和信通综合监控运维方案自动采集、存储、分析设备状态数据,通过设备远程控制和自动化编排运维的能力,对设备进行远程调控和维护,快速提高工作效率的同时,降低IT运维成本,保障电力信息系统稳定、高效运行。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/7577.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Linux动态库与静态库解析

文章目录 一、引言二、C/C源文件的编译过程三、静态库1、静态库的定义和原理2、静态库的优缺点3、静态库的创建和使用a、创建静态库b、使用静态库 四、动态库1、动态库的定义和原理2、动态库的优缺点3、动态库的创建和使用示例a、创建动态库b、使用动态库 五、动静态库的比较 一…

Python使用多进程和多线程处理数据

多进程适合于计算密集型任务和需要大量计算资源的场景,而多线程适合于I/O密集型任务和需要快速上下文切换的场景。 多线程版本 import time import concurrent.futures from tqdm import tqdmfile_list [file1.txt, file2.txt, file3.txt]*10def process_file(fi…

最长连续序列(Lc128)——哈希表

给定一个未排序的整数数组 nums ,找出数字连续的最长序列(不要求序列元素在原数组中连续)的长度。 请你设计并实现时间复杂度为 O(n) 的算法解决此问题。 示例 1: 输入:nums [100,4,200,1,3,2] 输出:4 …

Pytorch学习笔记——神经网络基本框架

一、神经网络是什么 神经网络在人工智能和深度学习的领域,一般称为人工神经网络,即ANN(Artificial Neural Network),是一种模仿人脑神经系统工作方式的计算模型。被广泛应用于人工智能、自动控制、机器人、统计学等领域的信息处理中。 二、…

套管外径测量仪 多尺寸型号 规格全可定制

套管(bushing)是一种将带电导体引入电气设备或穿过墙壁的一种绝缘装置。前者称为电器套管,后者称为穿墙套管。套管通常用在建筑地下室,是用来保护管道或者方便管道安装的铁圈。套管的分类有刚性套管、柔性防水套管、钢管套管及铁皮…

【快速幂取模】

求 a 的 b 次方对 p 取模的值&#xff0c;其中 1≤a,b,p≤109 输入 三个用空格隔开的整数a,b和p。 输出 一个整数&#xff0c;表示ab mod p的值。 样例输入 Copy 2 3 9样例输出 Copy 8 思路&#xff1a; 这里借鉴一下大佬的用例&#xff1a; #include<bits/stdc.h&…

idea提示 CreateProcess error=206, 文件名或扩展名太长有哪些具体的解决方法

背景&#xff1a; 项目启动后提示CreateProcess error206&#xff0c;通常我本地是将shorten command line改成如下就可以解决&#xff0c;但是今天遇到一个&#xff0c;无论这里怎么设置都是启动提示扩展名太长&#xff0c;经过一番处理问题终于解决&#xff0c;特此记录一下。…

《21天学通C++》(第十八章)STL list和forward_list

std::list的特点 1.插入和删除操作高效&#xff1a;在任意位置插入或删除元素的开销是 O(1)&#xff0c;不需要像 std::vector 那样可能需要移动大量元素。 2.不支持随机访问&#xff1a;访问 std::list 中的元素需要从头开始遍历到所需位置&#xff0c;访问特定元素的时间复杂…

面试笔记——垃圾回收

对象被垃圾回收的时机 垃圾回收主要面向的是堆中的对象。简单一句就是&#xff1a;如果一个或多个对象没有任何的引用指向它了&#xff0c;那么这个对象现在就是垃圾&#xff0c;如果定位了垃圾&#xff0c;则有可能会被垃圾回收器回收。 如果要定位什么是垃圾&#xff0c;有两…

linux命令行与shell脚本大全——学习笔记(7-8章)

第7章 理解Linux文件权限 用户、用户组、其他用户 用户权限是通过创建用户时分配的用户 ID&#xff08;user ID&#xff0c;UID&#xff09;来跟踪的。UID 是个数值&#xff0c;每个 用户都有一个唯一的 UID。但用户在登录系统时是使用登录名&#xff08;login name&#xff…

分布式锁-快速入门

文章目录 前言一、基础概念1.1 什么是锁1.2 什么是分布式锁1.3 锁和事务的区别二、分布式锁基础理论2.1 为什么要使用分布式锁2.2 分布式锁特性2.3 分布式锁的实现方式总结前言 由于在平时的工作中,线上服务器是分布式多台部署的,经常会面临解决分布式场景下数据一致性的问题…

TRILL解析

Deep Imitation Learning for Humanoid Loco-manipulation through Human Teleoperation解析 摘要1.简介2. Related work2.1 人形机器人的局部操纵2.2 远程操作示范中的模仿学习 3. 方法 论文链接&#xff1a;https://arxiv.org/abs/2309.01952 论文项目&#xff1a;https://ut…

通过mask得到bbox(numpy实现)

在SAM的加持下&#xff0c;我们很容易得到物体的mask&#xff0c;但是物体的bbox信息通常也很有用。那么&#xff0c;我们可以写一个函数&#xff0c;立马可以通过mask得到bbox。 代码如下&#xff1a; import numpy as npdef mask2bbox(mask):nonzero_indices np.nonzero(m…

运维开发工程师教程之MongoDB单机版设置

MongoDB单机版设置 一、创建虚拟机 在VMware Workstation软件中新建一个虚拟机&#xff0c;具体操作步骤如下&#xff1a; ①运行VMware Workstation软件&#xff0c;进入到主界面&#xff0c;单击“创建新的虚拟机”来创建新的虚拟机&#xff0c;如图3-1所示。 图3-1 VMware…

Anaconda安装教程

1Anaconda 简介 Anaconda是一个数据科学平台&#xff0c;提供一个发行版的 Python 以及大量常用的数据科学包、库和工具。通过包含诸如 NumPy、Pandas、SciPy、Matplotlib等核心库&#xff0c;以及 Jupyter Notebook等开发工具&#xff0c;使数据分析、机器学习和数据可视化变…

stm32和树莓派的区别?

在开始前我有一些资料&#xff0c;是我根据网友给的问题精心整理了一份「stm32的资料从专业入门到高级教程」&#xff0c; 点个关注在评论区回复“888”之后私信回复“888”&#xff0c;全部无偿共享给大家&#xff01;&#xff01;&#xff01;Stm32和树莓派是两个不同的领域…

从零搭建xxl-job(一) :单体项目多模块项目搭建

maven配置&#xff1a; 属性解释&#xff1a; <groupId> 在Maven中&#xff0c;groupId是一个项目的唯一标识符&#xff0c;它通常是公司或组织的反向域名&#xff0c;例如com.example.project。groupId在Maven的依赖管理中也非常重要&#xff0c;因为它可以确保依赖项…

百度副总裁秒批离职,00后的职场逆袭?

“员工闹分手提离职我秒批”&#xff0c;百度副总裁璩静的职场经历和思考在近期引发了大量讨论。 璩静在小红书分享了自己作为女性管理者&#xff0c;面对团队内部的感情问题&#xff0c;是如何处理的&#xff1a; “我第一时间就跟这个年轻的女孩子说&#xff0c;你走吧&…

SAP 财务借贷理解

以下只是个人理解&#xff0c;如果觉得有问题&#xff0c;千万别被带偏哈&#xff1a; 1、了解一些俚语&#xff1a; 有借必有贷&#xff0c;借贷必相等 资产 负债 所有者权益 收入 - 费用 利润 T字记账 2、 资产 、负债 、所有者权益、收入 、费用 、 利润 哪些增加或者减少…

如何创建git并上传

Git的配置和上传主要涉及以下步骤&#xff1a; 一、Git的配置 安装Git&#xff1a;首先&#xff0c;你需要在你的计算机上安装Git。这通常可以通过访问Git的官方网站并按照其提供的安装指南来完成。 注册GitHub账户&#xff08;如果你还没有的话&#xff09;&#xff1a;在Gi…