黑科技揭秘:阿里云如何做到从业务宕机到恢复业务运行只用一分半钟时间

2018杭州云栖大会主论坛上,阿里云打造的混合云容灾方案惊喜亮相,并直接在现场进行了全过程的演示,凸显出阿里云技术的强大心智。

整个混合云容灾演示在5分钟内呈现了阿里云秒级RPO,分钟级RTO企业应用容灾的端到端流程,涵盖了一个典型云容灾场景的核心步骤。

众所周知,企业关键业务宕机会带来非常大的损失,而传统的自建容灾方案成本高昂运维复杂,因此高性能的云容灾服务正在成为企业业务持续性保障的优先选择。混合云容灾服务(HDR)-关键业务型的演示完整呈现了将本地服务器上运行的报账系统实时容灾复制到阿里云,并在出现宕机后在云上快速拉起恢复业务的全过程。

整个演示主要分为三个阶段:

1、容灾复制阶段 报账系统在运行业务的时候,工程师一键启动了容灾复制,首先通过快速全量复制将磁盘上的所有数据,包括操作系统,应用,文件等都复制到阿里云的云盘上,且限速35MBps来确保不影响业务正常运行。在全量复制完成后,就进入实时复制状态,RPO达到了5秒左右。

2、业务宕机阶段,现场工程师将服务器硬盘拔出,导致服务器宕机,业务中断。监控系统在几秒内钟探测到服务不可连接,客户端也无法再执行报账任务。

3、容灾恢复阶段,工程师启动云上容灾恢复。混合云容灾服务先在云上创建好与云下服务器配置一致的ECS,然后将复制了本地服务器磁盘数据的云盘挂载到ECS上并启动,当探测到ECS上的服务已经启动后,切换DNS。1分半钟之内,业务在云上恢复了运行,客户端的保障任务继续,实际演练中,RTO达到了90秒左右。

数据是数字化运营的核心
数字经济时代,数据正以超出想象的速度快速增长。短短几年,数据量已经从TB级别跃升到PB乃至ZB级别。

根据相关研究机构调查结果显示,2017 年全年数据总量将超过15.2ZB,同比增长35.7%。到2018 年全球数据总量达19.4ZB。未来几年全球数据的增长速度在每年25%以上,预计到2020年,全球数据总量将接近50ZB。

不可否认的是,数据是数字化运营的核心,数据安全决定企业的生死存亡。

数据中心事故面前,企业面临灾难性危机

2018年8月,某国际云厂商因销售人员在一个存储桶方面没有遵循其规范,导致数据泄露。

2018年7月,某国内云平台被曝出发生过严重故障,直接导致某创业公司数据全部丢失,使该创业公司面临前所未有的业务停摆危机。

2017年5月12日发生全球性WannaCry蠕虫病毒事件,银行的ATM提款机“罢工”,加油站的电脑“停业”,学校即将答辩学生的论文被加密。

2017年1月,某代码托管平台的运维人员在多终端操作切换时,误把生产环境当成测试环境,人为失误的把生产环境的数据库删除。

2014年11月份某金融支付公司出现系统故障,出现了高达近4亿多重复到账。

据IDC统计数据表明,十年间发生过灾难的公司,有55%当时倒闭,剩下的45%中,因为数据丢失,有29%也在两年之内倒闭,生存下来的仅占16%。

根据Gartner报告显示,在经历大型灾难而导致系统停运的公司中有2/5再也没有恢复运营,剩下的公司中也有1/3在两年内破产。

在此背景下,企业数据保护已迫在眉睫。

企业数字化转型,混合云架构灾备方案是首选。过去,传统灾备解决方案是基于容灾中心建设一套与生产中心类似的架构体系,虽然满足生产中心的数据备份和复制需要,但落地周期长、实施不便、设备昂贵、运维复杂等因素对企业造成重重挑战。

那么,相比于传统灾备解决方案,混合云备份容灾解决方案是高效率、高可用、高性价比、免运维的现代化灾备方案,可以帮助客户把文件、数据库、虚拟机乃至整机安全高效地实现本地备份或备份上云。同时,备份上云的应用服务器整机可以在云上以服务器虚机的形式直接拉起运行,满足所需的RPO和RTO保障业务连接性,实现云上容灾。

阿里云混合云备份容灾服务产品

混合云备份(Hybrid Backup Recovery,HBR)服务是一种简单易用且高性价比的在线备份服务,可以帮助客户把桌面机,服务器或者虚拟机的数据备份到阿里云上的备份存储库,为客户数据提供安全、高效的云存储备份管理服务。

混合云备份服务典型的应用场景一:针对不同IT环境的数据保护

满足不同IT环境的数据保护,包括本地数据中心物理机、虚拟化平台,以及阿里云上ECS服务器和其他公有云平台上的服务器

RPO和RTO要求不高,但能够保证数据安全、可恢复能力

 

混合云备份服务在场景一具有以下优势:
简单易用,服务即开即用,分钟级快速部署,减少学习成本;
采用加密、多副本满足安全可靠的云备份,数据可靠性达到11个9;
采用去重、压缩减少带宽占用和备份成本,同时可以利用非常有限的带宽将数据备份上云;
弹性扩容,存多少算多少,按量付费,同时也有多种折扣套餐可以满足预付费客户的要求;

混合云备份服务典型的应用场景二:多分支机构集中备份+跨区域容灾

不同省市、区域中有多个分支机构,各分支机构有相应的数据需要进行备份;
各个物理机房分别去部署备份设备,管理分散并且复杂,难以保证数据备份成功完成;
基于多区域容灾要求,希望将备份数据的副本保留在其他区域,防止区域性故障导致的数据或服务无法使用;

混合云备份服务在场景二具有以下优势:
各机房无需部署和管理备份存储硬件设备,降低管理复杂度和运维成本
实现数据备份统一管理;
高效的数据源变长重删,高达30:1的重删率,降低网络带宽和存储资源消耗,缩短备份窗口;
客户端数据永久增量备份上云,云备份库每个时间点副本都是全量,提高备份恢复的效率,实现快速恢复;

区别于混合云备份服务,混合云容灾(Hybrid Disaster Recovery,简称HDR)服务是一个为企业应用提供云+本地双备份与云容灾的服务。它可以对服务器整机,文件和应用进行保护,容灾服务器部署于本地数据中心用于快速恢复本地数据,同时备份数据同步上云灾备库用于做云上容灾,可以避免机房故障的同时还能够在云上恢复出业务服务器,满足业务连续性,平时还可以用于灾备演练或者数据分析使用;为了应对大数据集群架构的数据保护,混合云容灾服务发布首个公有云大数据灾备解决方案。

混合云容灾服务典型的应用场景一:核心业务实时复制上云+云上容灾接管

生产环境需要进行实时复制,确保本地机房出现业务故障的情况下能够从云上快速地接管业务;
业务系统由数据库服务器、文件服务器、应用服务器等一整套服务器搭建而成;

混合云容灾服务在场景一具有以下优势:
满足客户对核心业务数据保护的同时,可以利用公有云平台能力实现异地容灾 ;
持续的数据保护和应用一致性保证,使RPO可达秒级水平;
弹性扩展,按需配置,平时云上无需创建ECS服务器,比起基于OS层的传统实时复制方案减少20%以上的成本;
编排式的一键容灾模式,可以预先部署好容灾接管的各个关键步骤,使整体RTO在分钟级完成;

混合云容灾服务典型的应用场景二:本地备份+按需配置上云容灾

生产环境需要进行本地备份,确保本地机房出现数据误删除、磁盘故障的情况下能够从本地快速恢复数据;
本地备份数据要进行异地容灾,确保本地数据中心出现灾难事故时,业务能在容灾中心快速恢复,使业务中断时间较短;
业务系统由数据库服务器、文件服务器、应用服务器等一整套服务器搭建而成;

混合云容灾服务在该场景二具有以下优势:
满足客户本地备份要求的同时,可以按需配置异地容灾,利用公有云平台能力,使客户在无需自建容灾机房的情况下,就可以实现灾难情况下业务快速恢复,节省70%灾备成本;

弹性扩展,按需配置,平时云上ECS不用恢复和启动,客户只需要用到云端的灾备库资源,云灾备库资源支持弹性扩容;

云下数据中心定时备份使数据备份RPO在小时级别,云上或云下整机容灾恢复RTO在小时级别;

高可靠,依托于阿里云的基础架构,确保在需要容灾恢复的时候,业务能安全可靠的数据可以进行及时恢复;

混合云容灾服务典型的应用场景三:本地备份+按需配置上云容灾
本地数据中心Hadoop大数据集群,有百TB级别数据,自建同等规模异地容灾集群会造成大量闲置资源,成本太高;
要求RPO接近0,传统distcp方案无法满足要求;

混合云容灾服务在场景三具有以下优势:
充分利用公有云资源,搭建云上大数据集群;
采用异步实时复制技术,RPO接近0,平滑扩展上云;
云上云下集群双活,两个集群运行不同业务,无资源闲置,TCO低
云上节点弹性扩展,快速稳定的计算资源满足业务量波动需要;

阿里云混合云备份容灾解决方案优势特点

优势一:分级RPO和RTO
支持多层次RPO和RTO满足不同业务的灾备等级需求;
核心业务实时复制,关键业务定时容灾,普通业务定时备份;

优势二:简单易用,5分钟启动备份服务
不需要任何硬件或者网关设备;
备份空间即买即用,易于扩展;

优势三:高性价比,按需购买
高达30:1的重删压缩比,30个副本只占用原来副本的1份空间;
采用永久增量技术,免去冗余不变的数据重复上传,免专线的情况下体验极速上云;
根据云端存储空间计量计费,而非源端备份数据量,极大地减少了备份费用;
利用公有云平台基础架构,相比传统容灾中心建设减少70%以上的成本;

优势四:安全可靠,多区域容灾
数据多版本备份,每个时间点都是完全副本;
高达12个9的云存储可靠性;
多AZ的备份库容灾,依赖云平台多可用区的支撑,数据多份保障;
可配置的跨区域异地容灾模式,可避免重大区域性故障导致的数据丢失;

优势五:整机灾备,无需业务改造
整机备份,整机恢复,可以在无需变更应用程序和IP地址的情况下,在云上重新恢复出与原来相同的业务系统出来;
整机上云的同时,还支持整机线下机房数据回流,方便在线下机房修复完成后的应用回迁;

优势六:主流平台支持,结构化和非结构化数据保护
操作系统:Windows、Linux;
系统平台:VMWare、Hyper-v、物理服务器;
数据库:SQL Server、Oracle等多种数据库;


原文链接
本文为云栖社区原创内容,未经允许不得转载。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/520825.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

恭喜你!在25岁前看到了这篇最最靠谱的深度学习入门指南

戳蓝字“CSDN云计算”关注我们哦!人工智能(AI)和机器学习(ML)在当下的火热程度我就不多说了,但是真正懂这方面的人又有多少呢?本文将带你了解人工智能和机器学习的基本知识。同时,你…

华为智能家居app未能连接上远程云服务_【InForSec通讯】智能家居云平台实体间交互状态安全分析 | Usenix2019...

论文题目:Discovering and Understanding the Security Hazards in the Interactions between IoT Devices, Mobile Apps, and Clouds on Smart Home Platforms论文作者: Wei Zhou, Yan Jia, Yao Yao&#…

黑科技揭秘:百种异常随机注入,专有云为何稳如泰山

关键应用服务中断引发一系列连锁反应,起因仅是一块磁盘被写满?为什么这么巧,两个小概率的问题偏偏一起发生,造成保护失效?为什么我们做了测试演练,然而真正发生问题依然踩坑?”2018杭州云栖大会…

负载均衡工具 haproxy 集群安装部署完整流程

负载均衡是系统设计最常见的一种方式,Nginx、HAProxy、LVS、F5用得比较普遍,不过Nginx只能在HTTP层负载,而HAProxy即可以在7层做负载,也可以在4层做负载,LVS配置有点太麻烦。 HAProxy是免费、极速且可靠的用于为TCP和基…

阿里云 MaxCompute 2018-09 新功能发布

2018年9月大数据计算服务 MaxCompute 又发布新功能啦! 【新功能】MaxCompute窗口函数支持WINDOW_CLAUSE 参考文档 适用客户 数据开发人员在进行数据开发过程中,用到调用window函数窗口时,SQL里反复写上OVER语句会显得冗余,MaxC…

要不要赶个时髦,去建设一个「 中台 」?

戳蓝字“CSDN云计算”关注我们哦!作者 | 奎哥责编 | 阿秃很多技术人总是抱怨 新技术/新框架/新概念 太多了,总是学不完,抱怨实在是学不动了。哈哈,这不,最近「 中台 」这么火热,要不要停止抱怨&#xff0…

strcpy用于调用的参数太少_C和汇编如何互相调用?嵌入式工程师必须掌握

ARM系列文章,请点击以下汇总链接:《从0学arm合集》一、gcc 内联汇编内联汇编即在C中直接使用汇编语句进行编程,使程序可以在C程序中实现C语言不能完成的一些工作,例如,在下面几种情况中必须使用内联汇编或嵌入型汇编。…

在阿里云上试用 Knative

在今年的Google Cloud Next大会上,Google发布了Knative, 这是由Google、Pivotal、Redhat和IBM等云厂商共同推出的Serverless开源工具组件,它与Istio,Kubernetes一起,形成了开源Serverless服务的三驾马车。 本文来自阿里巴巴中间件…

阿里云参加ONS EU 2018,飞天洛神亮相网络顶会

9月25日,荷兰阿姆斯特丹,为期3天的网络科技界盛会Open Networking Summit拉开序幕。来自世界各地的网络技术领域专家齐聚一堂,参与并分享各自分支领域的经验和成果。阿里云在会上展示了虚拟网络系统飞天洛神,智能网络管理平台齐天…

linux中如何在文件中查找文件,linux下find(文件查找)命令的用法总结

每一种操作系统都有成千上万的文件组成,对于linux这样“一切皆文件”的操作系统来说更不例外,大家应该都能很轻松使用windows下的文件查找功能,但是对linux这一功能可能并不是很熟悉,其实想玩linux的你更要牢牢掌握这个命令&#…

主动安全,新华三融合生态之力!

戳蓝字“CSDN云计算”关注我们哦!作者 | 晶少责编 | 阿秃出品 | CSDN云计算(ID:CSDNcloud)“如今网络安全形势错综复杂,解决方案不可能由一家公司独当天下,面对这样的情况,我们就要选择自身擅长…

阿里敏捷实践| 4个迭代,从批量交付向持续交付转型

导语 忙不完的事情,解不完的bug,每次发版都得集体熬个大通宵。干得多,结果还不好。阿里内部某研发团队就正处在这样的漩涡之中。 在这样的背景下,阿里云效敏捷教练团队受邀,和该研发团队一起,通过4个迭代…

阿里云携手爱迪德,发布中国首个云端DRM解决方案

2018杭州云栖大会期间,阿里云携手技术生态合作伙伴-爱迪德,推出中国首个云端DRM解决方案。该方案受CHINA DRM LAB和好莱坞六大电影公司认可,可以有效加强平台方对高价值版权内容的保护,监测和防止视频内容的盗版。 爱迪德中国区销…

idea升级2019.3后字体有的粗有的细

解决办法: 设置File–>Settings–>Editor–>Fallback font–>SimHei

飞天2.0 | 万物智能的基础服务

在2018杭州云栖大会的主论坛上,阿里云技术研发总经理蒋江伟发表了《飞天2.0,万物智能的基础服务》的主题演讲,从全连接、安全、简便、高速四个方面,阐述了飞天2.0网络的新特性。 蒋江伟表示,万物智能时代产生的海量数据…

黑科技揭秘:3分钟,轻松构建一张覆盖全球的企业专有网络

2018杭州云栖大会主论坛上,阿里巴巴研发技术总经理 蒋江伟在大会现场演示了分钟级构建企业专有网络的技术。 回顾一下当时的场景,一共有三步操作:上电, WAN口连接Internet,LAN口连接电脑,在工程师没有对设备…

恕我直言,有了这款 IDEA 插件,你可能只需要写 30% 的代码。。。

文章目录1. 安装(EasyCode)2. 建立数据库3. 在IDEA配置连接数据库4. 开始生成代码5. pom.xml6. Application.yml7. 启动项目8. 测试一下Easycode是idea的一个插件,可以直接对数据的表生成entity,controller,service,dao,mapper,无需任何编码,简单而强大。…

双十一提前预热,这款耳机直降80元!

还有不到10天时间就到双十一狂欢购物节了你们是不是已经把购物车加满了呢?反正的我已经加了好多了此时好想自己有个程序员男友帮我把购物车清空可惜了赶不上了之前推荐了一款兰士顿的T7R按键版蓝牙耳机大部分购买的用户给我的反馈说还不错哦但是也有一部分人问我有没…

阿里云朱照远:视频云2.0,更大规模、更智能、更清晰

在2018杭州云栖大会19号下午的主论坛上,阿里云视频云总经理朱照远发表了《视频云2.0,智享未来视界》的主题演讲,从超大规模、智能化、实时连接、超高清8K这四个方面,阐述了视频云2.0的定义。 朱照远表示,在这个超大规模…

这次的新计算,很全能!

在2018杭州云栖大会上,阿里云技术研发总经理蒋江伟发表了《全能计算,灵活稳定》的主题演讲,从函数计算、弹性容器实例、高吞吐ESSD云盘、弹性裸金属服务器、SCC超级计算集群这五个方面,阐述了飞天2.0计算的新特性。 蒋江伟表示&am…