头图 | 付费下载于视觉中国
提到IT运维,我们马上想到的,就是“7*24小时待命”、“救火”。作为IT安全运行的保障,长久以来,运维一直都是“不出事看不到价值,一出事全是锅”的角色。例如某企业自动化运维失效导致宕机,两大可用区计算引擎停运 93 分钟;再例如某企业云硬盘发生故障,导致部分用户的数据全部丢失,且不能完全恢复等。
纵观云计算在我国的发展,企业已经从用云转而进入上云、云化的阶段,云计算、数据中心已经成为新型基础设施重要组成部分。在“十四五”规划纲要中云计算部分,即提到培育包含运维管理等多种云服务产品。
企业全面云化下,新技术的运维“锅”更多了
近十年云计算的深入发展之后,在信通院2021年最新的《云计算白皮书》显示,多云、混合云成为主要形态。加之大数据、AI、区块链等新技术的应用,将带来多种异构资源的管理运维。而且云原生浪潮下,企业云上创新需求愈发强烈,导致了高级云服务多、技术迭代快,让企业在云上运维的要求越来越高。
新技术、新需求下,运维将面临新的挑战,具体来说分为以下四点:
首先,传统业务应用下,运维关注服务器、存储、网络、应用的运营保障,已经需要运维人员不断地积累多个领域的技术。而在云原生的激发下,运维技术与知识将再次暴增,云平台、云服务、安全、数据库、大数据、分布式、容器等,这些核心技术都需要运维人员去学习掌握。
第二,云的弹性灵活,也促进了业务快速扩展,应用创新的迭代加速。这需要系统更高频的变更或升级,操作愈加复杂。如升级变更与现网业务的方案分析,制订升级方案难度高。并且如果变更升级失败,还容易导致次生风险,增加再次修复的耗时。
第三,传统IT运维故障流程是扁平化的,但在混合云、多云、异构计算等复杂的环境下,如果发生故障,涉及IaaS、PaaS、应用等多层,增加了问题定位时长,故障处理流程的复杂度也随之增加。
最后,也因为第一个挑战,企业将更加需要各领域技术的高级运维专家。但如配置高级技术人才,实际运维中,他们也仅有20%时间处理复杂的问题,80%处理低阶日常维护工作,造成人力和技术资源的浪费。
新运维来了,关键能力是什么?
在各地大力发展IT基础设施的进程中,政企云平台从构思到落地远比想象的复杂,专业的经验和懂行的伙伴尤为重要。CSDN获悉,近日华为云(西安)运维中心正式揭牌运营,背后则是华为云Stack运维核心能力提供支撑。CSDN详细了解了华为云Stack运维技术的关键能力和核心优势,值得运维人的关注和思考。
首先,也是最根本的,是继续提高自动化运维的技术实力,用专业化的工具确保高效运维。华为云Stack运维中,提供了多种HCS智能化工具链,覆盖运维全生命周期。自动化工具与服务包括:操作、账户、资质等管理可信;看板、分析、预测等全栈监控工具;信息收集、故障诊断、巡检等智能分析工具;安全接入客户云档案、人员管理、操作记录等;局点、版本管理、升级的规划检查和校验等云服务迭代工具;多局点管理、远程IaaS安装、远程扩容等自动部署;问题、变更、备件管理等服务;告警监控、问题定位、日志分析、风险预测、故障处理、资产管理、性能分析等工具。
CSDN了解到,在实际客户案例中,通过华为云Stack运维的自动化运维工具,客户实现了一键式升级,改变传统手工脚本升级方式,享受版本新特性功能。另外,也帮助客户缩短了问题响应和故障处理时长,效率提升32%,降低业务中断风险。
运维第二个关键能力,是安全与隐私保护。安全运营是运维最终追求的目标,网络安全和用户隐私保护是华为公司的最高纲领,因此,华为云Stack运维旨在构建“1+2+5”安全体系,保障客户网络和业务安全,实现运维服务可控可信。在IOS27001认证与网络安全三级等保认证体系之下,华为云Stack运维体系包含:数据分类、处理、保护,合规审计等数据安全工作;安全策略、操作,客户端认证、授权等IT安全工作;人员安全培训、网络安全认证、持证上岗等人员安全工作;7*24小时CCTV监控、电源保障、火灾检测和消防、门禁等物理安全工作;方案审核、人员管理、高危命令校验/拦截、安全审计等作业可信工作。
第三,除了技术工具与安全,华为云Stack运维背后,是华为云多年、全行业积累的经验之和。华为云Stack运维提供资深专家队伍、全行业经验沉淀、海量知识库等云上保障护航。在华为云Stack运维专家团队中,方案专家、管理专家、技术专家均是有5-10年以上经验,以及专业技术认证的Top级运维专家。华为云Stack运维也汇集了华为云在运营商、政府、企业等重点行业核心客户的运维经验积累。在华为云Stack运维知识库中,包含10+行业、30+场景化的运维方案,1000+海量局点支撑海量知识库,高质量案例库,并达到高匹配率。另外,华为云Stack运维也包含基于角色画像的专业赋能体系;认证和作战结合的赋能方式。
在某运营商客户案例中,其业务规模达1300台服务器,承载了30多个厅局200+业务系统,由华为云Stack提供基于ITIL的标准、规范的统一运维服务,提供与公有云同版本、共演进的定期升级方案,升级周期从1+年缩短到0.5-年。高人力成本往技术服务支持中心聚合,降低客户运维成本300w/年(2名高级原厂工程师)。
技术之上,华为云Stack运维的战略规划
早在2008年,华为就开始了云计算的预研,如今华为云已成为全球五朵云之一,中国区政企的市场份额也位列第一。在刚刚结束的华为全联接2021上,华为高级副总裁,华为云CEO、消费者云服务总裁张平安针对政企客户用云的强烈需求,发布了华为云Stack8.1全新版本。新版本增加了AI推理、IoT、云桌面等8大服务。张平安还特意强调新版本增加了在线运维支持服务,帮助用户提升运维效率50%以上。
华为云Stack总裁尚海峰在阐述当前阶段政企对云的需求时表示:随着政企进入全面云化的阶段,云平台的规模快速扩大,通过大量的实践证明,政企云平台从构思到落地远比想象的复杂,因此专业的经验和懂行的伙伴尤为重要。
依托着前文的三大核心关键能力与优势,在华为云(西安)运维中心揭牌仪式上,也同期揭示了华为云Stack运维计划, 即在2025年接入1000局点,服务25w设备,最终构建1+3+N全球技术服务体系,打造全栈集中运维能力。
图:华为云Stack运维解决方案
为了实现全栈化运维服务体系,华为云Stack运维将构建五大关键能力:
关键能力一,是基于业界及华为最佳实践,形成一整套运维管理体系。以ITSS、ITIL、ISO27001等认证为指引,设计相关流程及标准化操作指导。结合华为三十余年IT+网络运维及安全治理经验,总结形成云运维最佳实践。运维与开发深度融合,和合作伙伴深度合作,实现低成本高质量运维。
关键能力二,是模式多样化,全面适配政企客户的多样化组织治理结构。以远程+本地,本地驻场模式,本地两极运维模式三种,为政企客户提供运维服务。
关键能力三,是多功能运维工具平台,保证运维安全与运维效率。打造工具的7层防护,70+种云服务和1400+个巡检项,将管理服务、运营指挥中心、服务工具、运维工具集均承载于云管平台之上。
关键能力四,是完善的集中运维安全管理机制,保障运维安全。例如建立信息安全风险管理体系、数据安全、IT安全、人员安全、物理安全、作业可信等,最终目标是构筑安全合规的管理体系、提供可信、可控、透明的运维服务。
关键能力五,华为全球交付与运维服务能力。华为云Stack将形成130+个华为代表处,全球4大集中运维中心,500多位原厂运维服务工程师与3万多位合作伙伴运维工程师的专家团队,30多年华为运维能力积淀,1套华为云自研运维工具平台。
最终,华为云Stack希望实现四大远景目标,是全栈云服务技术专家团队、全生命周期运维服务方案、全方位安全运营保障措施、全面智能化运维演进。
“华为云持续积累专业服务能力,结合全球一站式服务布局和专家体系,以西安运维中心为核心节点,将华为专业的运维人员、成熟的运维体系、领先的运维能力全面开放,让用户安心上云和用云,进一步聚焦业务创新,推动云计算产业更加良性健康发展。”尚海峰总结到。
纵观IT运维的发展历程,从最早的命令行和脚本代码的运维,到DevOps工具化运维,再到今天,IT运维已经从平台化向大数据运维转型中。而随着AI技术的深入,未来将是更加自动化、机器学习的AIOps运维时代。华为云在云计算时代,是IaaS市场中国第二、全球Top 5的云服务提供商,成绩背后,体现了华为云在laaS、PaaS、数据库、云原生、人工智能和物联网等等核心技术栈硬碰硬的实力。全栈技术挑战之下,运维的价值也将愈加重要。在蓄势聚力之后,华为云集中运维提供的“全栈”能力,也将持续发挥其独特的价值。