服务台需要跟踪的3个重要指标MTBF+MTTF+MTTR

衡量标准是IT服务管理的核心,可提供有关运营的见解,并帮助确定需要持续改进的领域。通常的服务台指标有助于展示内部运营效率。例如,衡量在规定时间内解决问题的工单数量的 SLA 是展示服务台效率的关键因素。另一方面,故障指标可帮助团队找出 IT 基础设施中的薄弱环节,并帮助评估对故障事件的响应。这有助于 IT 团队最大限度地减少故障可能对关键系统造成的连带影响。

IT服务管理

需要跟踪的关键失败指标是什么?在本文中,我们将看到探讨以下三个关键绩效指标:

1、平均无故障工作时间(MTBF)

当 IT 基础设施资产(无论是网络、服务器还是工作站等)频繁发生故障时,会对 IT 和业务服务的可用性产生连带影响。这些中断会导致收入和声誉的损失。如果某项 IT 资产经常出现故障,通常需要进行维修或更换。在此之前,调查并了解资产经常宕机的原因,以及是在什么情况下宕机,有助于制定资产维护计划,提高系统可用性。

平均无故障工作时间(MTBF)是帮助确定宕机原因的指标,有助于减少宕机时间或制定快速恢复计划,提高 IT 系统的可用性。如果某项 IT 资产的 MTBF 很低,就意味着该资产会经常停机,导致 IT 和业务中断。

MTBF 示例

在一家企业中,每当应用新的 Windows 固件更新时,存储驱动器的新更新总是失败。这种情况发生了几次,平均无故障工作时间变得越来越短。在对问题进行分析后,团队确定是第三方驱动程序导致执行更新所需的 API 无法实施或存在故障。当计划进行新的更新时,如果第三方驱动程序没有实施必要的 API,有两种可能的解决方案可供探索。比如将 API 与 SATA 和 NVMe 存储协议的 Windows 替代方案进行交换,或从原始设备制造商处获取新的、更好支持的驱动程序版本,都有助于实施更新、修复漏洞并堵塞安全漏洞。监控和跟踪驱动程序升级以及停机时间都有助于提高存储驱动器的可用性。

如何提高 MTBF

实施观察资产健康状况的流程,以跟踪和监控故障,有助于找出故障原因。

分析问题的根本原因,以提高认识、解决长期原因并提高资产性能。

制定快速反应战略,有效解决并减少影响运营的停机时间。目标是减少停机次数,延长停机时间。

2、平均失效前时间(MTTF)

资产经常出现故障会中断企业的 IT 运营,导致 IT 基础设施性能下降。MTTF 指标有助于确定资产、设备或组件的使用寿命。对于 MTTF 较低的 IT 资产和组件,通常更换 IT 组件比修复组件更省时,并能最大限度地降低运营影响和成本。

这尤其适用于与基础设施关键运行元素(如大型机服务器堆栈或网络接入点)相关联的 IT 组件。如果资产的 MTTF 不理想且经常出现故障,则表明 IT 资产不可靠,需要频繁更换,以免影响 IT 运营。

MTTF 示例

在一家 IT 软件开发公司,当数据和网络服务器堆栈中的交换机连接或断开电缆时,网络电缆就会松动、断开或损坏。由于数据传输中断,导致文件损坏。网络团队的进一步分析表明,CAT6 RJ45 跳线上的无卡塑料盖不断断裂。这是因为电缆是从使用廉价材料的制造商那里采购的。随后,IT 团队用质量更好的电缆替换了旧电缆,以确保今后移动电缆时不会出现数据丢失或损坏等问题。这是一个典型的例子,但定期跟踪电缆的 MTTF 有助于 IT 团队了解关键资产(如组件)的影响,从而就维修和更换做出明智的决策。

如何提高 MTTF

通过采购高质量的资产和停用低质量、低成本的资产来延长资产的使用寿命。

通过定期检查与关键资产相关的组件,防止大规模中断业务运营。

实施及时库存流程,估算资产的运行时间,从而降低资产存储的间接成本。

3、平均修复时间 (MTTR)

当关键 IT 系统发生故障时,IT 团队必须尽快恢复系统运行。延迟恢复 IT 系统会导致收入损失并影响关键业务运营。一个组织良好的恢复和响应系统可以帮助 IT 团队应对计划外停机,并有效地恢复运行。MTTR 衡量的是修复资产或排除故障并使其恢复运行能力所需的平均时间。

停机成本随着 MTTR 的增加而增加。MTTR 高说明恢复和响应操作不够迅速有效。系统故障是不可避免的,但 MTTR 能让团队对资产故障做出及时和战略性的反应。

MTTR 示例

一家软件公司正在开发的一款视频游戏因代码漏洞而遭到零时差攻击。这次攻击破坏了 Wi-Fi 和监控系统等操作。这导致攻击者访问了组织的网络域和机密业务文件。网络安全团队告知员工有关零日攻击的信息,以及他们可以在哪里报告这些攻击。该组织的所有 IT 资产都配备了下一代杀毒软件 (NGAV)。这次攻击导致局域网和员工自助服务门户瘫痪,使组织的运营陷入瘫痪。在攻击发生后一小时内,网络安全团队得到了 NGAV 的通知和帮助,NGAV 利用威胁分析和用户行为模式,识别出了可疑活动。网络安全团队立即运行补丁管理脚本,修正了代码中的漏洞,并锁定了内部网络,以避免进一步影响运营和数据窃取。

如何降低 MTTR

通过识别瓶颈、指定资产维修或更换,实行高效的资产管理战略,有助于推动更好的决策,还能够可以节省资金和存储空间。

明确技术人员的责任和角色,简化事故检测和解决流程。

为技术人员提供详细的标准操作程序,以减少停机期间的误传和混乱。

使用集中管理资产维护和监控信息的企业资产管理解决方案来衡量 MTTR。这还有助于优化资产利用率、收集资产数据和预测可能的停机时间。

结语

这些指标可帮助团队识别运营中的瓶颈及其对事件的响应能力,它们通过准确定位持续性事件的根本原因,帮助 IT 团队实现更高的运营效率。IT 团队可以清楚地了解 IT 运营受到影响的领域,从而改进其事件响应策略。企业可以将这些指标作为关键绩效指标而不仅仅是绩效目标来实施。这些指标指出了流程简化和运营改进的领域,而不仅仅是要达到的目标。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/166831.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

ate测试原理及ate测试系统(软件)知识科普 -纳米软件

ATE(Automatic Test Equipment)测试也叫自动化测试,通过计算机控制测试仪器对被测对象进行测试。以计算机编程代替人工测试,基于测试程序控制仪器并对待测品进行输入和输出信号检测分析,从而判断待测品的性能是否符合要求。 ATE测试需要根据测…

linux进程调度(一)-进程概述

一、什么是进程 进程是指计算机已运行的程序。程序本身只是指令、数据及其组织形式的描述。进程就是一个程序的执行实例,也就是正在执行的程序。在linux操作系统的中,进程就是一个担当分配系统资源CPU时间、内存的实体。进程控制的主要功能是对系统中的所…

2023年微软开源八个人工智能项目

自2001年软件巨头微软前首席执行官史蒂夫鲍尔默对开源(尤其是Linux)发表尖刻言论以来,微软正在开源方面取得了长足的进步。继ChatGPT于去年年底发布了后,微软的整个2023年,大多数技术都是面向开发人员和研究人员公开发…

HarmonyOS 设备管理开发:USB 服务开发指导

基本概念 USB 服务是应用访问底层的一种设备抽象概念。开发者根据提供的 USB API,可以获取设备列表、控制设备访问权限、以及与连接的设备进行数据传输、控制命令传输等。 运作机制 USB 服务系统包含 USB API、USB Service、USB HAL。 图 1 USB 服务运作机制 ●…

【SpringBoot3+Vue3】五【完】【实战篇】-前端(配合后端)

目录 一、环境准备 1、创建Vue工程 2、安装依赖 2.1 安装项目所需要的vue依赖 2.2 安装element-plus依赖 2.2.1 安装 2.2.2 项目导入element-plus 2.3 安装axios依赖 2.4 安装sass依赖 3、目录调整 3.1 删除部分默认目录下文件 3.1.1 src/components下自动生成的…

渲染农场渲染一分钟动画需要多少钱?需要渲染多少时间?

现在很公司都开始使用渲染农场渲染动画,但是还是有很多人不知道渲染农场渲染动画需要多少钱,需要渲染多少时间。在这篇文章中我们将为你一一解答,为你提供一个清晰的参考。 渲染农场的收费通常是按照渲染的使用时间收费,渲染十分…

华大基因助力乌兹别克斯坦精准医学发展,共筑健康丝绸之路

今年上半年,中国与中亚五国元首齐聚陕西西安,举办中国-中亚峰会。过去的20年里,中国已经成为中亚国家的主要投资来源国,总投资额接近400亿美元。乌兹别克斯坦是中国-中亚合作机制的重要参与者,乌…

CAD随机多面体_圆柱试件3D插件

插件介绍 CAD随机多面体_圆柱试件3D插件可用于在AutoCAD软件内生成随机三维多面体及外侧圆柱体试件。插件可确保多面体之间不发生干涉,且多面体与外侧圆柱体试件之间保持适配关系,确保生成的模型导入有限元软件后几何合理有效。本插件主要可应用于三维混…

讲概念谈愿景AI Agent名不副实?看实在智能RPA Agent智能体如何落地!

OpenAI在首届开发者大会上推出了GPTs和Assitant API,不仅改写了AI Agent的构建范式,也把AI智能体的应用推向一个新高潮。GPTs和GPT商店,使得用户无需编码通过自然语言就能创建并拥有多个专属私人助理,且可以如在苹果应用商店一样在…

Y-MODEM协议定制上位机

最近在使用N32G031和STM32F10X系列单片机进行IAP,使用的是Ymodem协议。单片机上的软件已经完成了,一般是使用secureCRT这样的工具作为上位机来进行测试,后来想做一个定制化的简单的上位机。在网上找了下资料,以下这篇文章写的使用…

浅谈安科瑞无线测温设备在挪威某项目的应用

摘要:安科瑞无线温度设备装置通过无线温度收发器和各无线温度传感器直接进行温度值的传输,并采用液晶显示各无线温度传感器所测温度。 Absrtact:Acre wireless temperature device directly transmits the temperature value through the wireless temp…

基于51单片机倾角MPU6050老人跌倒远程GSM短信报警器+源程序

一、系统方案 1、本设计采用这51单片机作为主控器。 2、MPU6050角度值送到液晶1602显示。 3、红外传感器检测心率。 4、跌倒远程GSM报警。 二、硬件设计 原理图如下: 三、单片机软件设计 1、首先是系统初始化 void LCD_Init() //初始化液晶时间显示 { write_com…

yarn:无法加载文件 C:\Users\***\AppData\Roaming\npm\yarn.ps1,因为在此系统上禁止运行脚本

原因:PowerShell 脚本的执行有着严格的安全策略限制! 解决方案:管理员身份启动Windows PowerShell 在命令行中输入set-ExecutionPolicy RemoteSigned 再使用yarn就可以了

SQL常见函数整理 _ LAG() 向上偏移

1. 用法 窗口函数,用于访问窗口中当前行之前的行的数据。该函数可以根据需要计算当前行之前的值,使我们能够轻松地比较不同行之间的差异和变化。 2. 基本语法 LAG(column, offset, default_value) OVER (ORDER BY column)column:代表在返回…

【UE5】资源(Asset)

了解UE游戏的基本构成 资源(Asset): 在UE中,资源(Asset)是指游戏中使用到的各种素材,例如模型、纹理、材质、声音、动画、蓝图、数据表格、关卡等(通常以uasset结尾),他…

土壤教学经典用图30张

一、土壤分布 二、土壤形成与气候 三、土壤形成与地形 四、土壤形成与成土母质 五、成土过程示意图 六、土壤剖面实景图 七、土壤剖面示意图 八、土壤质地 以上图片多来源于 人教、湘教、鲁教、中图、沪教 五套新教材及地图册

忘记7-zip密码,如何解压文件?

7z压缩包设置了密码,解压的时候就需要输入正确对密码才能顺利解压出文件,正常当我们解压文件或者删除密码的时候,虽然方法多,但是都需要输入正确的密码才能完成。忘记密码就无法进行操作。 那么,忘记了7z压缩包的密码…

YOLOv3老矣尚能战否?基于YOLOv3开发构建建钢铁产业产品智能自动化检测识别系统,我们来与YOLOv5进行全方位对比评测

钢铁产业产品智能自动化检测识别相关的项目在我们前面的博文中已经有了相应的实践了,感兴趣的话可以自行移步阅读即可:《python基于DETR(DEtection TRansformer)开发构建钢铁产业产品智能自动化检测识别系统》 《AI助力钢铁产业数字化,pytho…

OPPO VOOC快充原理

1 USB 3.0标准A插头 USB 3.0连接器是基于USB 2.0改进而来的,这个设计给USB 3.0连接器带来了一些潜在风险,如果USB 3.0设备插入主机的速度太慢,3.0的针脚还没来得及被识别到,就会被主机判定成USB 2.0的设备。 Figure 1-1 USB 3.0标…

centos系统下,docker安装sqlserver并用本地Navicat连接

文章目录 一,centos下安装docker二,docker安装sqlserver20192.1 安装遇到的问题2.1.1 修改用户名进不去数据库2.1.2 安装2022版的sqlserver发现启动失败 三,Navicat连接centos下的sqlserver3.1 下载ODBC Driver 参考微软网址: 使…