运维质变育新机,华为云能否引领政企运维破局?

头图 | 付费下载于视觉中国 

提到IT运维,我们马上想到的,就是“7*24小时待命”、“救火”。作为IT安全运行的保障,长久以来,运维一直都是“不出事看不到价值,一出事全是锅”的角色。例如某企业自动化运维失效导致宕机,两大可用区计算引擎停运 93 分钟;再例如某企业云硬盘发生故障,导致部分用户的数据全部丢失,且不能完全恢复等。

纵观云计算在我国的发展,企业已经从用云转而进入上云、云化的阶段,云计算、数据中心已经成为新型基础设施重要组成部分。在“十四五”规划纲要中云计算部分,即提到培育包含运维管理等多种云服务产品

企业全面云化下,新技术的运维“锅”更多了

近十年云计算的深入发展之后,在信通院2021年最新的《云计算白皮书》显示,多云、混合云成为主要形态。加之大数据、AI、区块链等新技术的应用,将带来多种异构资源的管理运维。而且云原生浪潮下,企业云上创新需求愈发强烈,导致了高级云服务多、技术迭代快,让企业在云上运维的要求越来越高。

新技术、新需求下,运维将面临新的挑战,具体来说分为以下四点:

首先,传统业务应用下,运维关注服务器、存储、网络、应用的运营保障,已经需要运维人员不断地积累多个领域的技术。而在云原生的激发下,运维技术与知识将再次暴增,云平台、云服务、安全、数据库、大数据、分布式、容器等,这些核心技术都需要运维人员去学习掌握。

第二,云的弹性灵活,也促进了业务快速扩展,应用创新的迭代加速。这需要系统更高频的变更或升级,操作愈加复杂。如升级变更与现网业务的方案分析,制订升级方案难度高。并且如果变更升级失败,还容易导致次生风险,增加再次修复的耗时。

第三,传统IT运维故障流程是扁平化的,但在混合云、多云、异构计算等复杂的环境下,如果发生故障,涉及IaaS、PaaS、应用等多层,增加了问题定位时长,故障处理流程的复杂度也随之增加。

最后,也因为第一个挑战,企业将更加需要各领域技术的高级运维专家。但如配置高级技术人才,实际运维中,他们也仅有20%时间处理复杂的问题,80%处理低阶日常维护工作,造成人力和技术资源的浪费。

新运维来了,关键能力是什么?

在各地大力发展IT基础设施的进程中,政企云平台从构思到落地远比想象的复杂,专业的经验和懂行的伙伴尤为重要。CSDN获悉,近日华为云(西安)运维中心正式揭牌运营,背后则是华为云Stack运维核心能力提供支撑。CSDN详细了解了华为云Stack运维技术的关键能力和核心优势,值得运维人的关注和思考。

首先,也是最根本的,是继续提高自动化运维的技术实力,用专业化的工具确保高效运维。华为云Stack运维中,提供了多种HCS智能化工具链,覆盖运维全生命周期。自动化工具与服务包括:操作、账户、资质等管理可信;看板、分析、预测等全栈监控工具;信息收集、故障诊断、巡检等智能分析工具;安全接入客户云档案、人员管理、操作记录等;局点、版本管理、升级的规划检查和校验等云服务迭代工具;多局点管理、远程IaaS安装、远程扩容等自动部署;问题、变更、备件管理等服务;告警监控、问题定位、日志分析、风险预测、故障处理、资产管理、性能分析等工具。

CSDN了解到,在实际客户案例中,通过华为云Stack运维的自动化运维工具,客户实现了一键式升级,改变传统手工脚本升级方式,享受版本新特性功能。另外,也帮助客户缩短了问题响应和故障处理时长,效率提升32%,降低业务中断风险。

运维第二个关键能力,是安全与隐私保护。安全运营是运维最终追求的目标,网络安全和用户隐私保护是华为公司的最高纲领,因此,华为云Stack运维旨在构建“1+2+5”安全体系,保障客户网络和业务安全,实现运维服务可控可信。在IOS27001认证与网络安全三级等保认证体系之下,华为云Stack运维体系包含:数据分类、处理、保护,合规审计等数据安全工作;安全策略、操作,客户端认证、授权等IT安全工作;人员安全培训、网络安全认证、持证上岗等人员安全工作;7*24小时CCTV监控、电源保障、火灾检测和消防、门禁等物理安全工作;方案审核、人员管理、高危命令校验/拦截、安全审计等作业可信工作。

第三,除了技术工具与安全,华为云Stack运维背后,是华为云多年、全行业积累的经验之和。华为云Stack运维提供资深专家队伍、全行业经验沉淀、海量知识库等云上保障护航。在华为云Stack运维专家团队中,方案专家、管理专家、技术专家均是有5-10年以上经验,以及专业技术认证的Top级运维专家。华为云Stack运维也汇集了华为云在运营商、政府、企业等重点行业核心客户的运维经验积累。在华为云Stack运维知识库中,包含10+行业、30+场景化的运维方案,1000+海量局点支撑海量知识库,高质量案例库,并达到高匹配率。另外,华为云Stack运维也包含基于角色画像的专业赋能体系;认证和作战结合的赋能方式。

在某运营商客户案例中,其业务规模达1300台服务器,承载了30多个厅局200+业务系统,由华为云Stack提供基于ITIL的标准、规范的统一运维服务,提供与公有云同版本、共演进的定期升级方案,升级周期从1+年缩短到0.5-年。高人力成本往技术服务支持中心聚合,降低客户运维成本300w/年(2名高级原厂工程师)。

技术之上,华为云Stack运维的战略规划

早在2008年,华为就开始了云计算的预研,如今华为云已成为全球五朵云之一,中国区政企的市场份额也位列第一。在刚刚结束的华为全联接2021上,华为高级副总裁,华为云CEO、消费者云服务总裁张平安针对政企客户用云的强烈需求,发布了华为云Stack8.1全新版本。新版本增加了AI推理、IoT、云桌面等8大服务。张平安还特意强调新版本增加了在线运维支持服务,帮助用户提升运维效率50%以上。

华为云Stack总裁尚海峰在阐述当前阶段政企对云的需求时表示:随着政企进入全面云化的阶段,云平台的规模快速扩大,通过大量的实践证明,政企云平台从构思到落地远比想象的复杂,因此专业的经验和懂行的伙伴尤为重要。

依托着前文的三大核心关键能力与优势,在华为云(西安)运维中心揭牌仪式上,也同期揭示了华为云Stack运维计划, 即在2025年接入1000局点,服务25w设备,最终构建1+3+N全球技术服务体系,打造全栈集中运维能力。 

图:华为云Stack运维解决方案

为了实现全栈化运维服务体系,华为云Stack运维将构建五大关键能力:

关键能力一,是基于业界及华为最佳实践,形成一整套运维管理体系。以ITSS、ITIL、ISO27001等认证为指引,设计相关流程及标准化操作指导。结合华为三十余年IT+网络运维及安全治理经验,总结形成云运维最佳实践。运维与开发深度融合,和合作伙伴深度合作,实现低成本高质量运维。

关键能力二,是模式多样化,全面适配政企客户的多样化组织治理结构。以远程+本地,本地驻场模式,本地两极运维模式三种,为政企客户提供运维服务。

关键能力三,是多功能运维工具平台,保证运维安全与运维效率。打造工具的7层防护,70+种云服务和1400+个巡检项,将管理服务、运营指挥中心、服务工具、运维工具集均承载于云管平台之上。

关键能力四,是完善的集中运维安全管理机制,保障运维安全。例如建立信息安全风险管理体系、数据安全、IT安全、人员安全、物理安全、作业可信等,最终目标是构筑安全合规的管理体系、提供可信、可控、透明的运维服务。

关键能力五,华为全球交付与运维服务能力。华为云Stack将形成130+个华为代表处,全球4大集中运维中心,500多位原厂运维服务工程师与3万多位合作伙伴运维工程师的专家团队,30多年华为运维能力积淀,1套华为云自研运维工具平台。

最终,华为云Stack希望实现四大远景目标,是全栈云服务技术专家团队、全生命周期运维服务方案、全方位安全运营保障措施、全面智能化运维演进

“华为云持续积累专业服务能力,结合全球一站式服务布局和专家体系,以西安运维中心为核心节点,将华为专业的运维人员、成熟的运维体系、领先的运维能力全面开放,让用户安心上云和用云,进一步聚焦业务创新,推动云计算产业更加良性健康发展。”尚海峰总结到。

纵观IT运维的发展历程,从最早的命令行和脚本代码的运维,到DevOps工具化运维,再到今天,IT运维已经从平台化向大数据运维转型中。而随着AI技术的深入,未来将是更加自动化、机器学习的AIOps运维时代。华为云在云计算时代,是IaaS市场中国第二、全球Top 5的云服务提供商,成绩背后,体现了华为云在laaS、PaaS、数据库、云原生、人工智能和物联网等等核心技术栈硬碰硬的实力。全栈技术挑战之下,运维的价值也将愈加重要。在蓄势聚力之后,华为云集中运维提供的“全栈”能力,也将持续发挥其独特的价值。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/513906.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

封神-运维大脑 | 日志检测工具

简介: 封神-运维大脑 | 日志检测工具1. 背景目标 阿里云应用业务有问题,云平台监控可以发现问题,但并不能定位到问题根本原因,运维大脑监控底层日志,可快速定位问题原因,帮助现场运维同学解决问题。 运维大…

hive sql练习_经典的SparkSQL/Hive-SQL/MySQL面试-练习题

经典的SparkSQL/Hive-SQL/MySQL面试-练习题​mp.weixin.qq.com第一题需求:已知一个表order,有如下字段:date_time,order_id,user_id,amount。 数据样例:2020-10-10,1003003981,00000001,1000,请用sql进行统…

世纪联华的 Serverless 之路

简介: 2019 年 双11 过后,世纪联华快速上云,将线上核心业务改造为全 Serverless 架构的中台模式,采用“函数计算API 网关OTS”作为计算网络存储核心,弹性支撑日常和大促峰谷所需资源,轻松支撑 618 / 双11 /…

“5G+AI”到底有啥用?这篇漫画告诉你答案…

作者|小枣君来源|鲜枣课堂根据工信部最新的数据,截至8月份,我国5G基站数量已超过百万,达到103.7万个。面对这张全球规模最大的5G网络,我们不禁会思考——它究竟会发挥怎样的作用?它的价值到底体现在哪?它会…

Kubernetes 稳定性保障手册 -- 可观测性专题

简介: 伴随大家对稳定性重视程度的不断提升、社区可观测性项目的火热,可观测性成为了一个很热门的话题,站在不同的角度会产生不同的理解。 我们从软件开发的生命周期出发,尝试形成对可观测性的一个宏观理解,并从 SRE 和…

读懂 Redis 源码,我总结了这7点心得

作者|Magic Kaito来源|水滴与银弹阅读本文大约需要 8 分钟。你好,我是 Kaito。用了这么久的 Redis,也翻了很多次源码,经常有人问我到底怎么读 Redis 源码。一提到读源码,很多人都会比较畏惧,认为读源码是高手才会做的事…

linux c url下载文件,OpenCV教程之使用cmake生成MakeFile时下载文件

在编译OpenCV以及其附加模块时,有时会需要一些第三方的库,如果本地没有,会自动下载,下载地址一般为GitHub,结果当然就是卡死在那里,根本无法下载,下面教大家如何解决这种问题。问题重现比如我在…

OpenTelemetry 简析

简介: OpenTelemetry 是 CNCF 的一个可观测性项目,旨在提供可观测性领域的标准化方案,解决观测数据的数据模型、采集、处理、导出等的标准化问题,提供与三方 vendor 无关的服务。 2021.02.10,OpenTelemetry 的 tracing…

涨姿势 | 一文读懂备受大厂青睐的ClickHouse高性能列存核心原理

简介: 本文尝试解读ClickHouse存储层的设计与实现,剖析它的性能奥妙 作者:和君 引言 ClickHouse是近年来备受关注的开源列式数据库,主要用于数据分析(OLAP)领域。目前国内各个大厂纷纷跟进大规模使用&…

xp正版验证补丁_实操web漏洞验证——IIS HTTP.sys 整数溢出漏洞

一、漏洞描述Http.sys 是一个位于 Windows 操作系统核心组件,能够让任何应用程序通过它提供的接口,以 Http 协议进行信息通讯。微软在 Windows 2003 Server 里引进了新的 HTTP API 和内核模式驱动 Http.sys,目的是使基于 Http 服务的程序更有…

普通公司编程水平与BAT大厂相比,差距到底有多大?

前言BAT的牛人多,普通人也多,虽然他们不是每个人都能达到令人仰望的技术水平,但毕竟平台高,所以眼光会变得宽阔;代码要求更为严格,所以普通的程序员也会被逼变得更优秀;身边的牛人多&#xff0c…

mindi linux 使用教程,Linux使用入门教程之tuned

tuned是RHEL6推出的调优工具,可以简单、动态的调整系统。默认的tuned软件包包含9个调优配置文件,对laptop、desktop、server系统的省电策略、磁盘调度算法、缓存、内存脏页回写等等的调节。tuned包安装后有两个服务,tuned和ktune,…

货运物流移动端解决方案:为货运物流行业打造高性能、高粘性的“双端”触点

简介: 在业务碎片化的情景下,怎么通过平台做整合,建立你的专业化运维池? 从 2020 年发展网络货运以来,在互联网和大数据的协作下,传统的物流企业逐渐转向信息化模式,在政策的不断推动下&#xf…

互联网泛娱乐直播安全的解决之道

简介: 阿里云的CDN和视频云产品在直播安全场景下有广泛的应用,阿里巴巴集团的淘宝、优酷等业务的直播正是基于这些产品底层能力,构建了强大的直播安全体系。这个基于阿里巴巴集团自身业务实践打磨出来的架构设计,也被众多上云客户…

wps office2019PC版和Mac版_学用系列WPS教育版的“十八般武艺”

相信不少朋友都在使用wps进行办公学习,但相信不少教师学生肯定不知道其实WPS还很用心提供教育版,里面有不少实用且好用的学习工具可以让我们的学习如虎添翼。今天胖胖老师就为大家介绍一下新版本WPS教育版的“十八般武艺”,欢迎大家一起来尝鲜…

只因“薪水过高”!被欠薪三个月后遭解雇,程序员删库反击

译者 | 弯月 责编 | 王晓曼出品 | 程序人生 (ID:coder _life)非技术出身的公司创始人往往并不了解开发人员的价值。如果他们的产品是科技产品,那么开发人员就是公司的燃料。我从一位同事那里听到了这个故事。故事的主人公叫做小…

linux模拟内存数据落盘,Linux:保证数据安全落盘

背景在很多IO场景中,我们经常需要确保数据已经安全的写到磁盘上,以便在系统宕机重启之后还能读到这些数据。但是我们都知道,linux系统的IO路径还是很复杂的,分为很多层,每一层都可能会有buffer来加速IO读写。同时&…

阿里云高级技术专家周哲:阿里云边缘云原生应用实践

简介: 为什么需要边缘云原生?边缘云原生的技术特性和优势是什么?它可以为行业提供哪些关键能力?又有哪些场景适合边缘云原生呢?在MEC全球应用开发者大会的“MEC开放论坛”上,阿里云高级技术专家周哲进行了《…

dataframe 如何选中某列的一行_PySpark和SparkSQL基础:如何利用Python编程执行Spark(附代码)

作者:Pinar Ersoy翻译:孙韬淳校对:陈振东本文约2500字,建议阅读10分钟本文通过介绍Apache Spark在Python中的应用来讲解如何利用PySpark包执行常用函数来进行数据处理工作。Apache Spark是一个对开发者提供完备的库和API的集群计算…

重磅官宣:Nacos2.0 发布,性能提升 10 倍

简介: 继 Nacos 1.0 发布以来,Nacos 迅速被成千上万家企业采用,并构建起强大的生态。但是随着用户深入使用,逐渐暴露一些性能问题,因此我们启动了 Nacos 2.0 的隔代产品设计,时隔半年我们终于将其全部实现&…