史诗级云故障敲响警钟,应用保障不能没有“连续键”!

近日,知名云服务商出现一次史诗级的云故障:全球所有区域/所有服务同时异常,故障持续长达3小时之多,云上众多应用受到极大影响。

如今,在一个充满不确定性和复杂性的数字化时代,哪怕是顶级云服务商亦不能避免各种故障的发生。这无疑再次为广大企业与组织敲响警钟,即当数字化转型步入深水区,业务应用全面走向线上化和智能化之际,我们的业务连续性到底应该如何保障?

正如AWS CTO Wanner所言:“Everything fails, all the time。”我们需要接受任何时候故障都可能会发生,既然故障无法避免,那么需要做的就是预测什么时候出现故障、发现故障原因,并确保业务连续性受到最小影响,将损失降到最低。

因此,企业数字化转型中缺少不了应用保障的“连续键”,应用级灾备的建设已成为企业数字化转型中的一道必答题。

应用保障不能没有“连续键”

塔勒布的《反脆弱》认为,不确定性的世界充满不确定性和脆弱性,反脆弱就是在波动和不确定中避免损失,甚至获利。

显然,在数字化时代中,随着新技术、新场景、新应用的大量涌现,企业的业务环境和市场环境早已今非昔,充斥着复杂性与不确定性,而数字化转型则是企业应对不确定性和脆弱性最为有效的方法。

Gartner《2023年CIO和技术高管议程中国篇》报告就显示,36%的中国企业将数字化转型作为企业最优先业务,并且在积极加大投入以响应市场竞争的需求。

这其中,业务连续性的保障又是重中之重。企业与组织数字化转型的不断深入,业务全面走向数据驱动和智能化的同时,外部攻击、人为错误、运行故障、自然灾害等对业务连续性的影响日渐突出。业务一旦中断,损失往往是企业不能承受之重,业务应用保障已不能没有“连续键”。

从政策法规要求层面来看,《网络安全法》、《等保2.0》、《商业银行业务连续性监管指引》等政策法规陆续颁发,标志着法律法规对于企业的数据安全与业务连续性监管要求日趋严格。

不过,传统灾备方案正成为业务连续性的“拦路虎”。在多云架构、复杂业务和海量数据的趋势下,企业自身IT环境走向复杂化,传统灾备方案应用级观测难、建设难度大、故障定位难和应用级可用性难保障,很难适用现代化复杂应用环境,

“一个省级政务云的办公与公文审批就有将近100个关联应用、上万名用户,应用之间依赖关系盘根错节。业务系统的复杂导致各种运维难题,并且问题定位和根因分析困难。”爱数技术专家介绍道,“企业与组织需要升级全新一代的应用级灾备,实现端到端的业务连续性管理。”

应用级灾备,为业务按下“连续键”

如何真正构建起全新一代应用级的灾备体系?

爱数认为,构建新一代的应用级灾备需要将灾备与可观性性技术进行深度融合,然后分为四个步骤:应用识别、应用级灾备建模、故障监控与定位和应用级灾难恢复。

既然复杂性已是一种“新常态”,爱数的思路是第一步先打破传统灾备的局限,帮助企业与组织了解和认知自身应用环境的复杂性。正所谓“知己知彼方能百战不殆”,只有充分识别海量复杂环境、应用架构特点,后续进行辅助故障设计和灾备建模才能有的放矢。

在完成对于海量复杂环境的识别之后,就可以进行应用灾备建模,包括应用系统可观测性、灾备容灾和灾难恢复计划建模,实现灾难恢复计划工作的前置。之后,故障监控与定位就像是一双“慧眼”,可以帮助企业与组织进行健康度观察和故障的快速定位,有效缩短故障半径,为接下来的灾难恢复提供极大便利。第四步则是应用级灾难恢复,实现灾难恢复、恢复验证、灾难恢复演练的快速进行,确保业务连续性,让故障发生造成的损失降到最低。

“新一代的应用级灾备覆盖了架构与业务发展、灾备保护、故障定位、灾难恢复、故障回迁的全流程,实现1-5-10模型,即一分钟发现问题,五分钟定位问题,十分钟拉起业务,从事前、事中和事后保障业务的连续性。”爱数技术专家如是说。

事实上,目前市场中相关灾备方案并不少,但像爱数这种将灾备与可观测性技术融合的创新组合式解决方案则非常稀缺。得益于在灾备、可观测领域的多年实践,爱数敏锐地观察到灾备与可观测性的融合,可以彻底突破传统备份的局限,真正让应用级灾备为复杂应用环境保驾护航。

用理念与技术变革灾备

众所周知,过去的灾备体系“重中有余而灵巧不足”,企业一旦投入巨资把灾备体系建成,后续几乎固定不动;但前端应用与场景如今却是瞬息万变,让应用的保障需求与灾备体系逐渐形成鸿沟,愈发匹配不上。

为此,爱数大胆将灾备与可观测性进行深度融合,构建起新一代应用灾备解决方案,在理念和技术层面彻底重塑了灾备。

在理念层面,爱数真正将“数据驱动”理念融入到灾备体系之中。灾备与可观测性两个产品之所以可以做到深度融合,得益于底层数据的打通。在统一引擎和技术栈的帮助下,爱数采用SuperAgent同一个客户端来抓取数据,并打通备份数据湖与机器数据湖,实现应用数据与灾备之间的关联。

在“数据驱动”理念的加持下,爱数新一代应用级灾备解决方案就能够对复杂、多变的应用环境进行梳理和识别,并能够观测到应用的持续变化,将应用的保障需求与灾备体系形成有效的对接。

在技术层面,爱数凭借多年在灾备领域和可观测领域的实践和经验,在应用识别、应用级灾备建模、故障监控与定位等环节中构建数据智能能力,通过模型的构建以及持续学习、智能分析,来实现应用级灾备多个环节的“化繁为简”,真正让应用级灾备变得可用和好用。

以应用系统环境的识别与分级为例,一些应用规模越大的企业动辄需要花费数月时间来完成这个环节,不仅费时费力费人,效果往往还不理想;而爱数利用多年在灾备领域积累形成的数据智能能力,实现应用系统环境的快速识别与分析。

“灾备不应该成为企业的负担。爱数希望通过新一代应用级灾备方案来改变过去僵化的灾备方式,让企业聚焦应用与业务,形成灾备的管理能力,从容应对各种不确定性。”爱数技术专家最后表示道。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/163019.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

并行与分布式计算 第9章 算法设计

文章目录 并行与分布式计算 第9章 算法设计9.1 设计过程9.1.1 PCAM设计过程9.1.2 划分9.1.3 通信9.1.4 组合9.1.5 映射 8.2 设计方法8.2.1 划分技术9.2.2 分治9.2.3 平衡树技术9.2.4倍增技术9.2.5 流水线技术9.2.6 破对称技术 并行与分布式计算 第9章 算法设计 9.1 设计过程 …

一张图,了解美格智能高算力AI模组

美格智能高算力A模组,澎湃算力让AI触手可及!

数字化背景下,集流体行业的智能制造方法论

行业背景 随着全球对清洁能源需求的不断增加,新能源领域正在迅速崛起,在新能源技术中,锂电池作为一种高效、轻便的能量储存解决方案,正成为主流。而锂电集流体作为锂电池的核心部件,承担着电池内部电流分布的关键角色…

服务号可以迁移到订阅号吗

服务号和订阅号有什么区别?服务号转为订阅号有哪些作用?首先我们要看一下服务号和订阅号的主要区别。1、服务号推送的消息没有折叠,消息出现在聊天列表中,会像收到消息一样有提醒。而订阅号推送的消息是折叠的,“订阅号…

分布式篇---第二篇

系列文章目录 文章目录 系列文章目录前言一、你知道哪些分布式事务解决方案?二、什么是二阶段提交?三、什么是三阶段提交?前言 前些天发现了一个巨牛的人工智能学习网站,通俗易懂,风趣幽默,忍不住分享一下给大家。点击跳转到网站,这篇文章男女通用,看懂了就去分享给你…

基于Pytorch框架多人多摄像头摔倒跌倒坠落检测系统

欢迎大家点赞、收藏、关注、评论啦 ,由于篇幅有限,只展示了部分核心代码。 文章目录 一项目简介 二、功能三、系统四. 总结 一项目简介 深度学习在计算机视觉领域的应用已经取得了显著的进展,特别是在多人多摄像头场景下的摔倒跌倒检测。通过…

Vue环境的搭建

1.Vue开发的两种方式 (1)核心包传统开发模式 基于html/css/js文件,直接引入和辛堡,开发Vue。 (2)工程化开发模式: 主要是基于构建工具(例如,webpack)的环境中开发Vue…

福州大学《嵌入式系统综合设计》实验五:图像裁剪及尺寸变换

一、实验目的 在深度学习中,往往需要从一张大图中裁剪出一张张小图,以便适应网络输入图像的尺寸,这可以通过bmcv_image_crop函数实现。 实践中,经常需要对输入图像的尺寸进行调整,以适用于网络输入图片尺寸&#xff0…

查看sql语句执行计划并重建索引

晚上cpu报警显示当前cpu使用率达到90%以上,不到10%的空闲 先查询当前sql: #(ORACLE) SQL > set line 200 pages 1000 col event for a30 col program for a30 col username for a12 col sql_id for a15 col INST_ID for 9999 …

前端开发学习 (二) 事件修饰符、系统命令

其实,我们上一章的时候就已经说过了一些系统指令,这里详细介绍一下 一、v-on的事件修饰符 事件作用click点击时触发submit表单被提交时触发input输入框发生改变时触发keyup按键松开时触发keydown按键按下时触发mouseover鼠标悬停触发mouseout当鼠标移开…

安徽省广德市选择云轴科技ZStack Cloud云平台建设县级智慧城市

信创是数字中国建设的重要组成部分,也是数字经济发展的关键推动力量。作为云基础软件企业,云轴科技ZStack产品矩阵全面覆盖数据中心云基础设施,ZStack信创云首批通过可信云《一云多芯IaaS平台能力要求》先进级,是其中唯一兼容四种…

【Web】NewStarCTF Week1 个人复现

目录 ①泄露的秘密 ②Begin of Upload ③Begin of HTTP ④ErrorFlask ⑤Begin of PHP ⑥R!C!E! ⑦EasyLogin ①泄露的秘密 盲猜/robots.txt,访问得到flag前半部分 第二个没试出来,老老实实拿dirsearch扫吧 访问/www.zip 下载附件,拿到第二部分…

SpringCloud原理-OpenFeign篇(一、Hello OpenFeign项目示例)

文章目录 前言正文一、项目结构二、服务调用链路说明三、Rpc调用链路说明四、项目代码4.1 client 模块中的feign接口4.2 client 中的rest接口4.3 client 中的启动类4.4 server中的rest接口4.5 server中的配置文件 五、调试 附录附1:本系列文章链接 前言 本篇是Spri…

示波器探头讲解及案例分享

示波器探头讲解 示波器探头 分为X1、X10档: X1档,表示被测量的信号没有经过衰减进入示波器 X10档,表示被测量的信号衰减10倍进入示波器(当示波器也设置为10X档,直接读数即可,但是当示波器设置为1X档&…

1、开发工具介绍及软件安装

软件安装 百度网盘链接:https://pan.baidu.com/s/1J7sgXntt9eLNBhI1Dc6MsQ?pwd2023 提取码:2023 # 一 Keil5安装步骤: 激活: STC-ISP安装步骤: STC-ISP.exe安装即用 安装CH340_CH341驱动程序 所有学习课程和资源…

【vue】ant-design-vue的树结构实现节点增删改查

根据业务需要,实现树结构的节点新增编辑删除功能,主要逻辑是利用树节点的scopedSlots属性对其进行自定义改造,监听悬停事件在节点右侧出现增删改对应图标,点击图标出现弹窗表单对内容进行修改,具体代码如下&#xff1a…

蓝桥杯每日一题2023.11.23

题目描述 题目分析 本题使用递归模拟即可,将每一个大格子都可以拆分看成几个小格子,先将最开始的数字进行填入,使每一个对应小格子的值都为大格子对应的数,搜索找到符合要求的即可 (答案:50 33 30 41&am…

Python爬取京东商品销售数据进行数据分析示例代码,以口红为例

文章目录 一、准备工作驱动安装模块使用与介绍 二、流程解析三、完整代码四、效果展示关于Python技术储备一、Python所有方向的学习路线二、Python基础学习视频三、精品Python学习书籍四、Python工具包项目源码合集①Python工具包②Python实战案例③Python小游戏源码五、面试资…

2023年中国钒铁产量及行业进出口现状分析[图]

钒铁,银白色块状,一般分为桶装或吨袋包装,根据钒含量的不同分为50钒铁(FeV50)和80钒铁(FeV80),通过炉外法或电炉法冶炼生产,北方多以炉外法制取,南方多为电炉法生产。 钒…

Faster R-CNN源码解析(一)

目录 前言训练脚本(train_mobilenetv2.py)自定义数据集(my_dataset.py) 前言 Faster R-CNN 是经典的two-stage目标检测模型, 原理上并不是很复杂,也就是RPNFast R-CNN,但是在代码的实现上确实有很多细节,并且源码也非常的多&…