实践分享丨企业上云后资源容量如何规划和实施

简介: 企业上云后,云上的预算直接影响上云的优先级、进度、深度。预算投入的多少,与业务发展和资源需求的容量评估紧密相关。精准的容量评估,可以使企业上云的预算规划更科学,同时也更贴合业务发展阶段的需要。本文分享业务上云后企业该如何进行容量的规划和实施。

图片0-云计算.jpg

本文作者:阿里云技术专家李雨前

摘要

随着企业数字化转型、企业IT服务云原生化快速发展,客户上云的步伐更加紧凑,随之而来云上的预算直接影响上云的优先级、上云的进度、上云的深度。预算投入的多少,与业务发展有关,另外一个关键因素就是资源需求的容量评估

精准的容量评估,可以使企业上云的预算规划更科学,同时也更贴合业务发展阶段的需要。本文将分享企业业务上云后,如何进行容量的规划和实施

一、为什么要进行容量规划

企业数字化转型,企业IT服务云原生化正大踏步的发展,上云的或正在上云企业,常规的预算支出中就包含数字信息化或者IT软件服务支出。这部分的预算支出,其中就包含云上资源的预算投入,其核算依据之一:云上容量规划和实施

图片1-水库.jpg

日常生活中,需要“容量”规划的场景是很普遍的。例如:水库储水就是一个典型的动态“容量”规划过程,需要根据上下游水环境情况做库容的调控。例如:疫情期间,景区实行游客提前预约成功后购票入园的举措,需要根据防控要求做每日游客的总人数的调控。

同理,云上的业务也会动态发展变化,云产品服务依赖的算力资源也需要相应调整。我们把算力资源的用量规划抽象为容量规划。

企业上云后进行容量规划的必要性在于,企业的业务是动态发展的,业务依赖的云上算力资源也需要相应地动态调整。过多算力资源导致资源闲置、成本浪费,过少的算力资源影响业服务响应性能、阻碍业务快速发展。那么,企业上云后,如果不进行容量规划会产生什么问题呢?

首先,可能出现成本投入和业务发展不匹配。例如,当业务呈现快速发展的态势,业务依赖的算力资源需求也呈现上升趋势,此时,如果没有容量规划,很可能业务爆发期来的时候,后端服务能力不能及时跟上,进而影响业务持续、稳定发展,甚至错失业务的黄金发展时机。

图片2-企业发展.jpeg

另外,互联网技术的应用极大地拉近了服务消费者和服务提供者的距离,服务提供者的服务表现跨地域的高可用、稳定性已是常态化目标。针对这个目标,一种最直接的实现方案:进行地域间的容量冗余,从而在软硬件故障或者其他应急场景下,进行流量切换实现灾备。

总结起来就是:企业上云后,业务的容量规划是刚需,并且需要持续地规划。精准的容量规划,可以帮助业务的快速发展,避免算力支持成为业务发展的瓶颈、阻碍项,同时,企业业务跨地域服务的高可用、稳定性也能得到保障。

二、业务需求转化为容量规划

容量规划是为业务服务的,脱离业务实际状况的容量规划毫无意义。根据业务特征、业务发展阶段目标,制定和业务发展相匹配的容量规划,才是合理的规划。

无影云桌面.jpg

例如某A企业,B部门的业务需要人均一台办公电脑。目前采购的是阿里云的云桌面产品。今年预计B部门员工数量扩大10%,那么今年云桌面台数的容量规划也需要扩大10%。这个例子比较直观的好理解,实际上不同行业、不同业务特征的云上容量规划需要考虑的因素非常多。下面按通用的理解,进行拆解分析,如图1所示,自底向上逐步细分。

图1.png

图1-业务驱动的容量规划

因素1:业务需求的整体发展评估    

企业业务整体发展态势和评估是一切需求来源的根基,没有业务整体发展的充分评估,不可能输出合理、有效的容量规划评估。对企业来说,不会为了容量规划而规划,容量规划都是为业务发展服务的。业务整体发展评估自然就在“金字塔”的最底部。

因素2:业务需求云原生部分的发展评估

“金字塔”底部再上一层对应云原生部分的发展评估,云原生服务发展的比例直接关系到云上容量规划预算的比重。对于互联网行业,可能业务的主体都是云原生的;对于传统行业,如果只有企业管理信息化部分上云,那么云原生部分的发展评估就是很小的比重。

因素3:有限预算下,云上优先保障的需求评估

对企业来说,每一项的预算总是有限的,有限的资源服务应当优先服务关键业务的发展,从而实现投入产出比最大化的。对所有云上服务来说,存储数据库计算服务是基础的依赖项,一般这三块的规划和投入都是高优先级保障的。

因素4:业务云原生部分的连续性需求评估

对企业来说,在业务所有的发展阶段,业务的连续性至关重要,尤其是关键业务服务的连续性。所以,容量规划过程,需要关注、评估业务连续性在预算中的体现。例如核心业务依赖的计算资源,可以通过规划:包年包月的实例、弹性资源保障服务、资源预留服务等实现资源的确定性交付,从而保障服务的连续性。

参考资料:资源保障服务

资源保障概述 - 云服务器 ECS - 阿里云

因素5:业务云原生部分的地域容灾需求评估

对企业来说,不同的发展阶段,业务在地域服务的优先级可能有所侧重,那么容量规划需要感知地域。同时,服务的高可用,往往依赖地域之间服务容灾能力的建设。所以,预算需要平衡地域发展的需要。

因素6:业务云原生部分需求独立规划VS综合规划

在前面5个因素基础上,容量评估越来越具体化。接下来从因素6开始,规划需要考虑具体操作的方案影响。独立规划和综合规划依赖的输入不同,输出的方案也不同。例如前面提到的面向员工办公的场景,对云桌面的需求,因为云桌面的彼此相对独立,可以独立规划,独立交付。

例如对于大型Web服务的场景,因为依赖云数据库、云存储、流量带宽等多方面服务,所以容量评估需要整体打包评估、整体交付,避免短板效应。并且在评估具体容量多少的时候,依赖的评估工具和方案也不同。对于独立的规划,一般评估相对容易给出;对于综合的规划,阿里云的容量规划服务提供了全套的解决方案。

参考资料:容量规划服务

阿里云上稳定性保障服务-容量规划服务

因素7:不同云服务供应商当前折扣优惠信息评估

当业务容量规划细分到位后,明确了容量规划落地依赖的产品、工具,那么接下来需要感知折扣优惠信息

不同的云服务供应商,在不同的地域、算力产品上的有相关的活动、折扣。评估这部分内容,可以使得花相同的预算,购买到更多更实惠的算力资源。例如阿里云推出的SavingPlan + CapacityReservation 服务,实现了成本的节约和资源的确定性交付。

因素8:规划的容量交付时间表评估

容量交付时间表评估这一步就是输出在什么时间、什么地域、交付哪些算力资源、对应的预算是多少等具体的规划方案信息。过早或者过迟的交付,都可能与业务发展不匹配,甚至容量规划最终无法落地施行。

三、容量规划映射为资源购买量

上一节我们按分层的方式对容量规划需要考虑的因素做了自底向上的描述。规划评估的本质是:满足业务在合适的时间、地点的发展需要,规划出对应时间、地点的算力需求。

如图2所示,具体的需求到算力的映射方法有很多。下面假设:企业业务未来发展所需云上服务能力是可预测的,基于可预测的值,转化为具体的资源实例购买量需求,进而形成具体的购买方案。下面介绍常用的规划容量映射为资源购买量的技术方案。

图2.png

图2- 业务需求映射算力需求

方法一:线性映射--水平扩缩容

从资源视角来看,经典的评估方法是:资源实例总量 = 业务总的请求量QPS/ 单个资源实例支持的QPS。当业务发展需要更多的算力时,总的QPS会发生变化,此时需要新增扩容的的资源实例数量 = 新增的QPS/单机QPS。这种方式对应资源调度领域所说的“水平扩容”。阿里云提供的服务例如Auto Scaling 就支持自动水平扩缩容

参考资料:弹性伸缩

什么是弹性伸缩Auto Scaling - 弹性伸缩 - 阿里云

关于水平扩容更多内容可以参考K8s的HPA(Horizontal Pod Autoscaling):

Pod 水平自动扩缩 | Kubernetes

方法二:线性映射--垂直扩缩容

从资源视角来看,垂直扩容是相对水平扩容来说的。通过调整单机资源算力大小也就是调整单机支持QPS的大小(间接通过资源实例的降配来降低单资源实例支持的QPS),来调整总的资源实例数量,从而调整总的服务请求QPS。一般在精细化资源调度、业务负载混合部署场景下,会进行资源单实例的垂直扩缩容。

这种垂直扩缩有两种形态:一种是固定式的(规格调整后就不改变),例如从原来4VCPU,垂直缩容为2VCPU。然后实例按2VCPU 进行水平扩缩容;另外一种是非固定式的(短时间内单一算力资源的弹性伸缩),例如资源实例在运行过程中,进行某个维度资源的“限制”,从而实现单实例资源在特定场景下算力的调整。

对于业务方来说,看到的实例规格没有改变。典型的例如K8s的资源模型里面,如CPU资源申请,有request、limit两个参数,可以实现CPU资源的弹性burst。又例如阿里云突发性能实例,通过CPU积分来保证计算性能的实例规格,适用于平时CPU使用率低,但偶尔有突发高CPU使用率的场景。

参考资料:突发性能实例

突发性能实例概述 - 云服务器 ECS - 阿里云

关于垂直扩缩容更多内容可以参考GKE的 VPA (vertical-pod-autoscaler):https://cloud.google.com/kubernetes-engine/docs/concepts/verticalpodautoscaler

方法三:非线性映射--全链路评估

大型互联网服务,典型如电商交易系统,业务场景多、业务之间存在依赖性、业务服务规模大。已经很难按应用单独评估系统容量,需要在全链路场景压力下,进行整体的容量评估。

阿里云的容量规划服务,提供了全套服务,具体包括:

  • 服务规划,提供业务流量分析、数据容量分析、消息容量分析、数据库容量分析、集群容量分析;
  • 服务规划后执行,提供全链路压测方案、场景流量配比以及调度方案、限流降级方案、演练方案。

全链路评估的核心价值:帮助客户探测云上系统最佳压力、极限压力、破坏压力点,并进行降级、限流保护。采用全链路评估尤其适合大规模、复杂的场景应用。

参考资料:容量规划服务

阿里云上稳定性保障服务-容量规划服务

方法四:容量预测--自动调配

相对方法1、2、3,方法4 对未来容量的变化不做事前精准评估,基于系统负载均衡、系统QPS水位监控,进行自动化资源交付,包括自动水平扩容、缩容、跨规格实例交付等。例如阿里云弹性容器实例ECI支持多规格实例交付。阿里云运维编排服务OOS 提供的云上自动化运维服务,能够自动化管理和执行任务。客户可以通过模板来定义执行任务、执行顺序、执行输入和输出,然后通过执行模板来完成任务的自动化运行。OOS支持跨产品使用,您可以使用OOS管理ECS、RDS、SLB、VPC等云产品。

参考资料:弹性容器实例

阿里云帮助中心-阿里云,领先的云计算服务提供商

运维编排服务

什么是运维编排服务 - 运维编排服务 - 阿里云

综上,从业务需求到资源容量规划再到资源容量执行的过程,可以概括为图3所示这样的过程。

图3.png

图3-需求到容量执行

四、资源购买量落地选购方案

当明确了资源购买量后,落地具体的选购方案就是如图4所示,在业务发展时间轴线上,确定性地交付算力资源。

图4.png

图4-业务发展过程确定性算力资源交付

正如上一篇《三种典型场景下云上虚拟IDC(私有池)选购指南》介绍:业务资源交付有日常稳定性资源需求、日常弹性资源需求、突发资源需求。企业需要根据自身业务发展特征,具体资源需求,选择合适的资源选购方案,实现节约成本和资源确定性交付。例如:周期性资源需求、偶发资源需求、特定时期的资源需求,可以选购弹性资源保障相关产品服务。详细的容量规划到最终落地选购方案,可以直接参考该文。

企业业务上云后,需要进行资源容量规划,阿里云提供了丰富的产品能力支持业务容量精准评估灵活选购,特别是基于资源保障服务,如弹性保障、立即生效容量预留等服务,支持资源确定性交付,有力保障业务发展的连续性。

原文链接
本文为阿里云原创内容,未经允许不得转载。 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/512147.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

如果让你来设计网络

作者 | 闪客sun 来源 | 低并发编程 你是一台电脑,你的名字叫 A 很久很久之前,你不与任何其他电脑相连接,孤苦伶仃。 直到有一天,你希望与另一台电脑 B 建立通信,于是你们各开了一个网口,用一根网线连接了起…

【ESSD技术解读-01】 云原生时代,阿里云 ESSD 快照服务 助力企业级数据保护

简介:本文以云原生为时代背景,介绍了阿里云块存储快照服务如何基于高性能 ESSD 云盘提升快照服务性能,提供轻量、实时的用户体验及揭秘背后的技术原理。依据行业发展及云上数据保护场景,为企业用户及备份厂商提供基于快照高级特性…

又居家办公了,要签合同怎么办?

作者 | CSDN 来源 | CSDN云计算 本篇文章暨 CSDN《中国 101 计划》系列数字化转型场景之一。 《中国 101 计划——探索企业数字化发展新生态》为 CSDN 联合《新程序员》、GitCode.net 开源代码仓共同策划推出的系列活动,寻访一百零一个数字化转型场景,聚…

【ESSD技术解读-03】阿里云块存储企业级特性之异步复制

简介: 在大数据时代,数据就是企业的核心资产,是企业的生命线。在现实世界中,灾难时有发生,当发生灾难时,容灾能力成为企业能否生存的关键。云上容灾服务,通常称为 DRaaS(灾难恢复即服…

【ESSD技术解读-04】ESSD Auto PL规格,引领IO性能弹性新方向

简介: 阿里云 ESSD 为云服务器 ECS 提供低时延、持久性和高可靠的块存储服务,成为云厂商全闪块存储的业界标杆。存储团队推出了 ESSD Auto PL 新的云盘规格,把性能与容量解耦,提供 IO 性能按需供给两大关键特性。AutoPL 具备的灵活…

全民营销时代,让私域流量变成业务增量需要几步?

本篇文章暨 CSDN《中国 101 计划》系列数字化转型场景之一。 《中国 101 计划——探索企业数字化发展新生态》为 CSDN 联合《新程序员》、GitCode.net 开源代码仓共同策划推出的系列活动,寻访一百零一个数字化转型场景,聚合呈现并开通评选通道&#xff0…

跨越行业绊脚石,阿里云函数计算发布 7 大技术突破

简介: 2021 云栖大会现场,阿里巴巴研究员、阿里云智能云原生应用平台总经理 丁宇(叔同)重磅发布了函数计算的 7 大技术创新和突破,加速现代应用架构的革新。 Serverless 的本质是通过屏蔽底层的计算资源,来…

业内首款云原生技术中台产品云原生 Stack 来了

简介: 云原生 Stack 满足了各种典型场景下客户对于线下高集成平台的诉求,让企业数字话转型不受技术约束,专注业务本身,加速企业数字化迭代。 今天,企业数字化转型依然面临很大的挑战,虽然有很多新技术不断…

从质疑到成为必选项,低代码技术发展及 2022 展望

2022年,CSDN 「低代码产品开发者使用与体验」线上调研,正式开启!现在完成调研,就可参与抽奖活动,还有机会获得线下活动门票一张,和更多行业人士一起交流的机会。 前言 2022年低代码已经不是一个新鲜概念&am…

一图速览 | DTCC 2021大会,阿里云数据库技术大咖都聊了些什么?

简介: 3天9场干货分享,快来收藏吧! 10月18日~10月20日, 由国内知名IT技术社区主办的数据库技术交流盛会——DTCC 2021 (第十一届中国数据库技术大会)在京圆满落幕。大会以“数造未来”为主题,重点围绕数据架构、人工智…

AI深入应用,生态越加开放,开发者的机会在哪里?

作者 | 宋慧 出品 | CSDN云计算 IT 在吞噬一切,也在吞噬地球的能源消耗。 现在,全球的数据中心耗去了全球用电的 2%,到 2030 年时这个数字很有可能上升到 8%。风电,是地球上仅次于火电、水电的第三大电力来源,风电、光…

Serverless 工程实践 | 自建 Apache OpenWhisk 平台

简介: OpenWhisk 是一个开源、无服务器的云平台,可以在运行时容器中通过执行扩展的代码响应各种事件,而无须用户关心相关的基础设施架构。 OpenWhisk 简介 OpenWhisk 是基于云的分布式事件驱动的编程服务。OpenWhisk 提供一种编程模型&…

php弹幕技术轮询,PHP实现长轮询消息实时推送功能代码

入口文件index.html反ajax推送.send{color:#555;text-align: left;}.require{color:blue;text-align: right;}.content_box{text-align: center;margin: 20px;border: 1px solid #ddd;padding: 20px;}消息框12发送连接$(function(){//发送消息$(#btn_send).click(function(){va…

阿里云消息队列 RocketMQ 5.0 全新升级:消息、事件、流融合处理平台

简介: RocketMQ5.0 的发布标志着阿里云消息从消息领域正式迈向了“消息、事件、流”场景大融合的新局面。未来阿里云消息产品的演进也将继续围绕消息、事件、流核心场景而开展。 从“消息”到“消息、事件、流”的大融合 消息队列作为当代应用的通信基础设施&…

Gartner发布2022年政府行业重要业务趋势:数字化与创新、基础设施等

供稿 | Gartner 出品 | CSDN 云计算 时至2022年,政府领导人继续面临疫情带来不断变化的挑战,包括社会和经济领域的不确定因素。在2020年至2021年这段刚开始应对疫情的时期,为了满足公民服务和远程办公的需求,全球数字化程度呈指数…

随机段子api php,给博客添加一个名言段子语句随机播放的功能(集成Hitokoto)

之前浏览张戈的博客,发现他的文章页点赞下方有个很有意思的东西,一列显示一段句子,刷新一下会重新生成另外一个,主要包含段子、台词等有意思的话。余斗的博客不少内容都是参考张戈博客,虽然发现这个有趣的玩意很久了&a…

实践分享丨构建云上私有池(虚拟IDC)的5种方案详解

简介: 云上私有池系列终篇终于来了,本文将重点介绍构建云上的私有池(虚拟IDC)的多种方案和各自的优缺点,并给出相关的性价比优化建议。 本文作者:阿里云技术专家李雨前 摘要 围绕私有池(虚拟…

2021云栖大会开源引力峰会发布的战略合作,Grafana服务到底是什么?

简介: 这几天关注云栖大会的小伙伴一定会发现阿里巴巴合伙人、阿里云高级研究员蒋江伟(小邪)在云栖大会开源引力峰会的演讲中,特别提到了一个叫 Grafana 服务的产品,并特意花费一页 PPT 介绍了这一次合作。到底是一个什…

因为一个循环,CPU搞了个新技术

作者 | 轩辕之风O 来源 | 编程技术宇宙 好久不见,我叫阿Q,是CPU一号车间的员工。我所在的CPU有8个车间,也就是8个核心,咱们每个核心都可以同时执行两个线程,就是8核16线程,那速度杠杠滴。 我所在的一号车间…

AI圈内卷?天池团聚请来专家集体“问诊”

简介: 近期杭州云栖大会上出现了一个“数据博物馆”,最吸引眼球的“展品”,竟是行业大规模开源数据集。不仅数量多达上百个,还覆盖零售、文娱、工业、医疗、自然科学等数十个行业。既有来自真实业务场景的商品数据,也不…