客户案例|提质增速 某县医院运维升级实例

一、项目背景

2023年12月,安徽某县医院接入226个资产,正式成为平台客户。

据moc介绍,客户经历了3个月的长效试用期,通过对平台的监控效果、趋势预测、故障响应速度、技术支持、moc服务等全方位体验后,才谨慎地成为正式用户。不得不夸,运维工程师的认真严谨最让人服气!

二、故障处理

客户资产接入后,需求和服务的极限挑战正式开始。通过3个小案例了解。

1、夜间HIS系统反复重启

客户接入系统后,发现HIS系统总会在夜间反复重启,平台告警后数据工程师认为集群未产生异常报警,并未着急处理。

moc工程师认为核心系统告警需要提高警惕,要求数据工程师排查重启原因,最终锁定SQL Server数据库bug导致,进行打补丁更新,反复重启故障彻底解决。

2、大面积断电引发的网络问题

1月21日清晨7点半,平台接到该医院资产离线告警。

moc工程师沟通用户,得知该地区遭遇极端暴雪天气导致大面积停电。在恢复供电后,部分交换机未能自动重启。用户现场有一百多台交换机且分散在医院各个区域,靠人工检查定位重启,至少要半天时间才能完成,将会影响业务的正常开展。时间紧任务重,MOC工程师结合平台告警和设备状态监测,逐步定位排查,在30分钟内协助用户迅速恢复所有故障网络设备,保障业务的稳定进行。

3、磁盘空间使用率问题

接入平台后,值守工程师发现凌晨总会接到磁盘空间使用率不足告警,在处理工单时,告警磁盘的容量又恢复正常,完全能满足业务的需求。

通过三日空间使用时序图显示,磁盘每日凌晨开始备份,产生大量备份文件,在短时间内磁盘空间使用率就达到100%,空间不足导致备份失败,重新释放磁盘容量。这就是处理工单时一切看起来很正常的原因。数据备份失败可能导致数据丢失,moc工程师及时与现场工程师沟通,调整备份方案,将5日备份数据量调整为2日备份,在适合的时间对该磁盘进行扩容。

异常早发现,故障快处理,保障系统日常稳定运行,客户满意度持续飙升。

三、痛点分析

在医院信息化建设中,大部分医院已完成核心业务系统建设,且配套一定规模的网络、服务器、动环等系统。因此在制定运维服务方案时,需要在这几点特别关注。

1、厂商独立监控、数据割裂,形成数据孤岛。影响告警和根因定位的准确性,甚至告警风暴的产生,需要监控统一集中的监控。

2、资源管理难,缺乏对服务器CPU、内存等计算资源,磁盘空间、磁盘I/0等存储资源的监控,对系统应用节点和数据的各项性能参数配置等数据把控不足,难以实现科学的容量规划。

3、缺乏对核心业务系统监控,设备厂商监控工具仅对设备状态进行检测,无法对医院核心业务,如HIS、PACS等进行全链路可用性监控分析。

4、日常巡检以人工巡检为主,问题发现被动、滞后,难以保障系统稳定运行。同时人工巡检摸排时间长、问题处理效率低,也使运维KPI成效不显著。

四、方案亮点

一站式监控

异常、风险尽在掌握

以集中式采集监控和告警管理,将资产统一并入监控系统,对每个资源节点的状态、性能进行实时监控。监控不漏报、少误报、高响应,高效应对医院规模庞大的基础设施,网络设备、服务器、存储、应用等。

通过全栈数据采集分析,精准定位提供丰富数据分析,提升风险异常的精准度。用户可以避免无效告警、告警风暴的发生,快速对故障的排查和定位,全面提升告警管理能力。

自动巡检+AI精准预测

运维提速增效

                            

自动巡检可大幅提高巡检效率,内置多种常见的操作系统、数据库、中间件等巡检模版,满足日常巡检需求。支持灵活配置巡检指标以及阈值,高亮展示异常指标,组件性能状态一目了然。支持定时执行策略、巡检通知、生成word模版供存档,保证巡检任务有计划地执行。

AI精准预测,主动发现问题,对具有周期性、趋势性、季节性的指标,AI机器学习建立自适应的异常检测,自动调整动态阈值,高效管理告警。

7*24h在线+专家响应

事件能闭环

                            

依托于平台的实时监测分析,MOC专家做到分秒级响应,不到30分钟就能完成一次事件的“分析-定位-响应”。

为医院量身打造相应的应急处理流程,确保问题的响应时间和处理速度,MOC工程师全程在线,提供专业的解决方案,协调专家支持,保障系统快速恢复;故障解除后,MOC工程师会针对事件进行复盘汇报,查漏补缺,故障闭环处理大幅降低同类型事件再发概率。

平台内置大量案例,集中管理历史沉淀经验及常用场景知识,便于知识应用即查即用,提升问题解决效率,减少对专业人才的依赖;

智能运维使原来错综复杂的运维管理工作变的简单轻松,真正实现职责分明、安全高效、稳定可靠、智能管控的目标。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/723717.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

圆形动画 小球在轨道上循环运动 点击按钮停止开始 在次点击 动画开始

圆形动画 小球在轨道上循环运动 点击按钮停止开始 在次点击 动画开始

Vue-04

Vue 指令 指令补充 指令修饰符:通过"."指明一些指令后缀,不同后缀封装了不同的处理操作 → 简化代码 按键修饰符 keyup.enter → 键盘回车监听 在input中使用keyup.enter,这个时候按enter键也能实现添加,和点击按钮实…

目前最新的集运行业发展及运营模式介绍

集运系统紧跟时代发展潮流,提供“集运系统代购商城”,通过系统掌握C端用户数据,发展代购、电商业务。 跨境电商物流市场蓬勃发展,拥有十万亿量级的增长空间,跨境电商市场规模及进出口总额都呈上升趋势,而未…

CAN总线的拓扑类型和CAN收发器(原理讲解)

1:CAN收发器(原理讲解) 从原理上来讲CAN_H拉升电压,或CAN_L拉低电压的原理。 以上是TJA1145AT的俯瞰图,此芯片是NXP比较先进的CAN收发器,带SPI总线系统。 回到正题,CAN_H和CAN_L收发器是通过内…

c++|内存管理

c|内存管理 C/C内存分布strlen 和 sizeof的区别 c语言动态内存管理方式malloccallocrealloc例题 c管理方式new/delete操作内置类型new/delete操作自定义类型证明 new 和 delete 的底层原理operator new与operator delete函数operator new 和 operator delete的 用法构造函数里面…

【unity实战】3D水系统,游泳,潜水,钓鱼功能实现

文章目录 素材将项目升级为URP画一个水潭地形材质升级为URP创建水调节水第一人称人物移动控制游泳水面停留添加水下后处理水下呼吸钓鱼参考完结 素材 https://assetstore.unity.com/packages/vfx/shaders/urp-stylized-water-shader-proto-series-187485 将项目升级为URP 这…

使用KVM服务创建虚拟机(简化版)

1. 规划节点 KVM服务虚拟机节点规划,见表。 IP主机名节点192.168.100.10localhostKVM 2. 基础准备 使用VMWare Workstation软件安装CentOS 7.2操作系统,镜像使用提供的 CentOS-7-x86_64-DVD-1511.iso,关闭防火墙并且配置SELinux规则&…

八年老程序员的一二月总结:回家过年、阅读挑战、线下新体验

大家好,我是拭心,一名工作八年的程序员。 每两个月我会做一次总结,为的是留一些回忆、评估自己的行为、沉淀有价值的信息。 回顾一二月,原来发生了这么多事,趁着周末记录一下吧。 有意义的事 1.回家过年 今年回内…

【STM32详解FLASH闪存编程原理与步骤】

STM32详解FLASH闪存编程原理与步骤 FLASH编程注意事项FLASH编程过程STM32的FLASH擦除过程FLASH全片擦除FLASH操作总结锁定解锁函数写操作函数擦除函数获取状态函数等待操作完成函数读FLASH特定地址数据函数 FLASH编程注意事项 1.STM32复位后,FPEC模块是被保护的&am…

基于单片机的数字温度计设计

目 录 摘 要 I Abstract II 引 言 1 1 整体方案设计 3 1.1 主控芯片类型选择 3 1.2 测温电路选择 3 1.3 系统总体方案 4 2 系统的硬件电路设计 5 2.1 单片机系统设计 5 2.2 显示模块设计 8 2.3 温度读取电路的设计 10 3 系统软件设计 13 3.1 软件开发环境的介绍 13 3.2 系统重…

MySQL基础-----SQL语句之DDL数据定义语句

目录 前言 开启登录数据库 一、数据库操作 1.查询所有数据库 2.切换使用数据库 3.查询当前使用的数据库 4.创建数据库 创建一个hello数据库, 使用数据库默认的字符集。 创建一个itheima数据库,并且指定字符集 5.删除数据库 二、表操作 1.查询当前数据库所有…

2024Android高级面试题,这些细节在Android面试上要注意了

前言 对于字节跳动的二面三面而言,FrameworkMVP架构HashMap原理性能优化Flutter源码分析等问题都成高频问点!然而很多的朋友在面试时却答不上或者答不全!今天在这分享下这些问点的视频解析给大家,希望对有需要的朋友有所帮助&…

【洛谷 P8720】[蓝桥杯 2020 省 B2] 平面切分 题解(计算几何+集合+向量)

[蓝桥杯 2020 省 B2] 平面切分 题目描述 平面上有 N N N 条直线, 其中第 i i i 条直线是 y A i ⋅ x B i yA_{i} \cdot xB_{i} yAi​⋅xBi​ 。 请计算这些直线将平面分成了几个部分。 输入格式 第一行包含一个整数 N N N。 以下 N \mathrm{N} N 行, 每行包含两个…

信号量 网络的学习

1.有名信号量 操作共享内存的步骤: ftok生成一个key值 ->通过key 用 smget 创建一组信号量(下标0,1区分),返回一个信号灯的ID -> 对信号灯的初始化 (struct sembuf 结构体成员的赋值 ,成员sem_op中-…

基于Google Vertex AI 和 Llama 2进行RLHF训练和评估

Reinforcement Learning from Human Feedback 基于Google Vertex AI 和 Llama 2进行RLHF训练和评估 课程地址:https://www.deeplearning.ai/short-courses/reinforcement-learning-from-human-feedback/ Topic: Get a conceptual understanding of Reinforcemen…

vue3 (四)动态组件Vs异步组件

1.动态组件 点击toggle切换2个组件&#xff0c;配合<keep-alive>使用防止切换后数据丢失 <keep-alive><component :is"currentItem"></component> </keep-alive> 2.异步组件 定义方法&#xff1a;app.component(组件名,Vue.defineAs…

西安雁塔未来人工智能计算中心算力成本分析

先看一例旧闻&#xff1a;西部“最强大脑”落户雁塔——30亿亿次超算能力助力创新之城建设 其中提到一期算力为 300PFLOPS FP16&#xff08;每秒30亿亿次半精度浮点计算&#xff09;&#xff0c;项目总投资约为19亿元。 这个算力是什么概念呢&#xff1f; 我们以深度学习训练中…

GIS之深度学习06:CUDA12安装(适配版)

CUDA&#xff08;Compute Unified Device Architecture&#xff09;是NVIDIA开发的并行计算平台和编程模型&#xff0c;用于利用NVIDIA GPU的并行计算能力&#xff0c;它允许开发者使用类似于C语言的编程语言编写并行程序&#xff0c;利用GPU的大规模并行计算能力加速各种类型的…

C语言写学生信息管理系统

说明:本博文来自CSDN-问答板块,题主提问。 需要:用C语言设计一个学生信息管理系统(尽量不使用指针),学生信息包括学号,姓名,数学成绩,C语言成绩,英语成绩和每个学生的总成绩这几项。系统要实现如下几个功能:1.添加学生2.删除学生3.修改学生信息4.查询学生信息5进行学…

关于Linux上的$ORIGIN解说

1、Linux RPATH & $ORIGIN 许多现代C / C 项目都利用Autotools创建GNU构建系统&#xff0c;例如 根据平台生成make文件。 可执行文件&#xff08;二进制文件&#xff09;在生成/编译过程中生成&#xff0c;并且可以在执行编译的计算机上本地执行。 但是&#xff0c;如果将…