浅谈IT 运维-变更管理

定义:

在企业的运维管理过程中,很多时候会有变更产生。这些变更通常来源于基础设施的升级,容量管理、可用性管理、软件更新、新服务的推出,服务级别目标的变化等等。

风险与问题举例:

变更在执行中常 常会引发以下一系列的负面影响

  1. 一个小小的变更引起了一个重大的故障。

  2. 一个变更进行中发现没有足够的资源可被使用来继续完成此变更。

  3. 紧急变更数量太大,导致团队成员疲于应付。

  4. 在业务窗口时间执行变更,导致业务时间段内业务中断。

  5. 一个变更未能在规定时间内完成或是虽然变更已完成,却效果不佳。此时发现此变更无法回滚。

核心问题1:为什么要有合理的变更分类

场景描述:

某个 IT 服务提供商已经实现了变更管理流程,在运营一段时间后,经常有客户抱怨说,他们提交的 变更审批得很慢,特别是一些紧急情况下的变更。更让客户难以接受的是,对于那些简单的低风险 的变更也同样也需要等待很长时间才能够被正式受理和审批。我们如何来改进这种现状呢?

解决方法:

将变更分成标准变更、紧急变更、正常变更

        作为变更管理最主要的目的是让企业的 IT 服务稳定性提高并控制风险,但这需要在稳定性和灵活性 之间做一个平衡。场景中的情形就是缺乏灵活性的表现。为了提高该企业的变更受理与执行的效率, 通常变更管理实施的第一步是先对变更请求进行分类,在风险和效率之间达到一种权衡,从而提高 执行变更的灵活性,最终达到提高客户满意度目的。

标准变更

        对于那些风险低的,影响度低的,而且是经常会发生的变更,如:新入职员工开设系统账号、为 他们开通邮件服务等。我们可以定义为标准变更:此类变更跳过繁琐的审批与评估过程,把变更的受理与执行权预先授予某一个职能单元,如:服务台。这样提高了此类变更执行的效率,必定 会提升客户对于此类变更执行的满意度。

紧急变更

        对于那些非常紧急的变更,由于时间上不允许有过多的拖延,并且不可能有太多的时间用于审批 甚至是测试,我们定义为紧急变更。对于这些变更我们直接直接由专家来执行,优先级设成最高 级,马上召开 CAB/EC(紧急变更顾问委员会)进行评估和直接获得最高级授权,直接获得变更执 行的相关资源,有效减少变更挂起的时长。从时间上缩短了受理与审批的周期。

正常变更

        对于兼顾风险和效率的变更我们定义为正常变更,并根据影其响度划分为不同的等级(如:Minor、 Significant、Major 等)。对于 Minor 类型的变更直接由变更经理审批,而不需要由 CAB 会议审 批,Significant 类型分配给周期性的 CAB 会议,定义为 Major 类型的通常是高风险、高影响度 的,直接由管理层来进行审批和评估。通过这样的分类能有效地进行风险控制,从而达到提高变 更成功率的目的。

        总结:由于有了一系列的分类,针对不同的变更给予不同的处理过程,避免了之前的所有变更都采 用相同的处理方式。实行一段时间后,客户满意度将有显著的提高。

核心问题2:变更导致故障

场景描述:

某企业在周一业务繁忙时段上线了一个新的应用——客户关系管理系统,此系统安装在某一台主机 上,此主机之前一直正常运行着另一套系统——备件采购管理系统。升级完以后发现客户关系管理 系统能够正常服务,但原有的备件采购管理系统无法登录,导致当天上午采购管理系统这个应用瘫 痪。IT 技术团队经过一个上午的努力排除了故障,找出了原因,并恢复了服务。但业务部门对 IT 却提出了严重指责,从管理的角度来思考,你更关注那个方面呢?问题何在?

解决办法:

技术角度:

        从技术的角度上来说,是由于之前主机上安装了一套采购管理系统,使用的是 SQL Server 数据库, 并且默认都是用 sa 帐号登录。新的应用同样使用 SQLServer 数据库,新系统使用的数据库也是 SQLServer 数据库,并且后台登录用户名也是使用了和采购管理系统相同的用户名 sa,但密码不同, 在安装新应用的过程中修改了原先的 sa 密码,所以导致原有的备件采购管理系统无法正常启动。

管理角度:

        从管理的角度上来说,变更的执行需要在适当的时间做,也就是说我们要选择一个变更窗口,在这 个时间内这样就不会影响到业务或是对业务影响最小。变更窗口设在什么时间段呢?很容易想到就 是下班后或是双休日,绝对不会是像周一这样的业务繁忙时段。这个新应用的安装最多也就在 2 小 时内可以完成,可选的时间段非常多。所以以上企业的问题是在非变更窗口时间执行变更,导致现 有的服务受到影响而中断。所以每一个正常变更在评估变更时就要考虑到变更的影响度,预先设定 好变更窗口。这样才能保证业务的正常运作。

核心问题3:把紧急变更比例控制在合理的区间

场景描述:

某个制造企业紧急变更的数量占变更总数量的 80%。很多情况下由于紧急变更没有足够的时间来进 行评估与测试,数量多的话会导致 IT 的稳定性降低。所以应该严格控制紧急变更的数量和比例,从 而减少变更的不确定因素。对于此种现状,如何应对和改善?

解决办法:

紧急变更 80%明显高得离谱。首先找到这类紧急变更的具体原因是什么,案例中发现,这些紧急变 更都来源于同一个分类,都是关于一个生产管理系统的软硬件的紧急变更。很多人认为此生产管理 系统非常重要,如果存在问题执行一系列的紧急变更也是没有办法。但谁又能保证如此多的紧急变 更能真正解决现有的故障率呢?紧急变更量大反而会使得系统更不稳定。就好比是拆东墙补西墙。

对于每一个重大变更都做好充分的评估与测试工作,这样可以避免在重大变更发布后,再跟进很多 修补的紧急变更。

在重大变更时设定一段试运行期,如果试运行评价报告不够好,或是不满足当初评估的预期,可以 考虑回滚,只有评估满足预期并稳定运行的变更,才会被变更。

总结:需要对紧急变更的数量和比例做好严格的控制,从而保证变更的稳定性。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/102159.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

iMovie for Mac:专业级的视频剪辑体验!

如果你是一位视频爱好者,那么你一定不能错过iMovie for Mac这款专业视频剪辑工具。它不仅拥有简单易用的界面,而且功能强大,可以让你轻松完成复杂的视频剪辑任务。 一、界面友好,上手容易 iMovie for Mac的界面设计简洁明了&…

NoSQL之 Redis命令工具及常用命令

目录 1 Redis 命令工具 1.1 redis-cli 命令行工具 1.2 redis-benchmark 测试工具 2 Redis 数据库常用命令 2.1 set:存放数据,命令格式为 set key value 2.2 get:获取数据,命令格式为 get key 2.3 keys 命令可以取符合规则的…

冲量在线荣获2023中关村科学城科创大赛成长组TOP10优秀项目!

2023年9月15日,由市科委、中关村管委会,市发展改革委,市经济和信息化局联合指导的2023中关村科学城科创大赛圆满落下帷幕,该项赛事聚焦人工智能大模型,互联网3.0等前沿领域,吸引了国内外近300个优质项目报名…

竞赛选题 深度学习 植物识别算法系统

文章目录 0 前言2 相关技术2.1 VGG-Net模型2.2 VGG-Net在植物识别的优势(1) 卷积核,池化核大小固定(2) 特征提取更全面(3) 网络训练误差收敛速度较快 3 VGG-Net的搭建3.1 Tornado简介(1) 优势(2) 关键代码 4 Inception V3 神经网络4.1 网络结构 5 开始训练5.1 数据集…

交易履约之结算平台实践 | 京东云技术团队

导读 京东科技业务在快速发展的同时,产生了众多线上化资金结算的需求。传统的线下资金结算模式有着人力成本高、耗时长、多方沟通协调成本高、结算准确率低等固有缺点,且无法满足“风法财审”对于资金流程的管控要求,在此背景下金道结算平台…

什么是统一端点管理和安全性

统一端点管理和安全是一种工具,可帮助 IT 管理、审核、监控和保护端点。除了内置的安全功能外,UEMS 还集成了对移动设备以及位于固定位置的设备的管理,管理操作包括分发软件和操作系统、安装补丁、收集资产详细信息、设备配置和实施安全策略。…

雪花算法生成ID传到前端之后精度丢失问题

第一种:使用注解解决 使用方便简单,粒度高,适用于部分字段需要单独转换的场景,灵活度高 // 两种注解,选其一即可 // JsonFormat(shape JsonFormat.Shape.STRING) JsonSerialize(using ToStringSerializer.class) pri…

【广州华锐互动】VR建筑施工事故体验:提高工人安全意识和责任感

VR建筑施工事故体验的意义在于通过模拟真实场景和情况,帮助人们更好地理解建筑施工中的安全问题,并提供一种安全、有效的方式来学习和掌握安全技能。 建筑施工是一项高风险的工作,涉及各种复杂的工作环境和操作过程。在现实中,建筑…

服务器数据恢复-服务器硬盘指示灯黄灯闪烁的数据恢复案例

服务器数据恢复环境: 服务器面板上的硬盘指示灯显示黄色是一种警告,提示指示灯对应的服务器硬盘已经被服务器识别出存在故障,硬盘即将下线。如果出现这种情况,建议服务器管理员/运维人员及时用完好的硬盘替换显示黄色指示灯对应的…

Redis - php通过ssh方式连接到redis服务器

1.应用场景 主要用于使用php通过ssh方式连接到redis服务器,进行一些操作. 2.学习/操作 1.文档阅读 chatgpt & 其他资料 SSH - 学习与实践探究_ssh应用场景 2.整理输出 2.1 是什么 TBD 2.2 为什么需要「应用场景」 TBD 2.3 什么时候出现「历史发展」 TBD 2.4 …

【总结】kubernates 插件工具总结

在此记录工作中用到的关于 kubernates 的插件小工具,以防以后忘记 1、能显示 kubernates 所处上下文的插件 kube-ps1 github 地址: https://github.com/jonmosco/kube-ps1 效果 2、能方便切换 kubernates 上下文的插件 kubecm github 地址&#xff1…

PreScan与MATLAB联合仿真报错

一、 问题: Error:Matlab ||和&&运算符的操作数必须能够转换为逻辑标量值 二、解决办法 必须安装VS2013(我装的VS2017不行的),然后重启prescan和MATLAB,编译通过,界面如下: 三、VS…

印度网络安全:威胁与应对

随着今年过半,我们需要评估并了解不断崛起的网络威胁复杂性,这些威胁正在改变我们的数字景观。 从破坏性的网络钓鱼攻击到利用人工智能的威胁,印度的网络犯罪正在升级。然而,在高调的数据泄露事件风暴中,我们看到了政…

【HTML】web worker

Web Worker是HTML5中的一项技术,可以在后台运行JavaScript代码,以提高Web应用程序的性能并改善用户体验。它允许在独立的线程中执行耗时的操作,而不会阻塞主线程。 主线程是浏览器用来渲染页面、处理用户交互和执行JavaScript代码的线程。然…

链接文件学习(七):英飞凌MCU Tasking编译器LSL链接文件解析 及代码变量定位方法

目录 1、Tasking的链接文件 1.1、DSRAM中的数据存放 1.2、PFlash中的代码存放 1.3、LMU 1.4、PSRAM 1.5、UCB 2、代码与变量定位 2.1、把变量放在 DSRAM

vue项目的学习周报03

学习周报 日期范围:2023年9月25日~2023年10月1日 学习目标:本周的学习目标是学习vue的基础知识 学习成果:在本周我完成以下任务和学习活动: 1.我完成了对vue.js的基础认识; 2.学习了通过index.js导入新的组件&#…

servlet基础知识

目录 什么是servlet概念/定义作用 servlet容器概念/是什么作用如何配置和管理 servlet生命周期有哪些生命周期每个周期中可以执行哪些操作 创建和编写servlet如何创建一个简单的servletservlet类的结构是什么样的如何处理HTTP请求和响应 servlet映射和URL模式什么是servlet映射…

服务器上部署python脚本

1.查看服务器上的python是否自带,一般都自带 2.将本地脚本上传到服务器 3.直接运行一下脚本看报什么错误 代码错误, 将f删除后报别的错误 上面是未安装依赖的错误。我们安装一下依赖 下面是编码的解决 #!/usr/bin/python # -*- coding: utf-8 -*- 先把…

公众号营业执照注销被冻结了,怎么迁移?

公众号迁移后原来内容还在么?通过公众号迁移,可以实现这些目的:主体变更、开通留言功能、多号合并、订阅号升级为服务号、服务号转为订阅号。公众号迁移流程:①办理公证;②提交迁移申请;③第三方审核&#…

macOS Sonoma 14.1beta3(23B5067a)发布

黑果魏叔10 月 11 日消息,苹果今日向 Mac 电脑用户推送了 macOS 14.1 开发者预览版 Beta 3 更新(内部版本号:23B5067a),本次更新距离上次发布隔了 7 天。 根据官方发布的macOS Sonoma 14.1beta3更新日志,此…