云栖大会 | 释放计算弹性,阿里云做了很多

戳蓝字“CSDN云计算”关注我们哦!
640?wx_fmt=jpeg

时至今日,已经没有人怀疑云计算是最主流的企业IT基础设施之一。围绕云计算最基础最核心的话题计算力,探讨在新硬件、新技术和新场景带来的机遇和挑战下,计算产品如何演进,使其价格更加低廉、供给更有保障、稳定性更好等,真正成为一种新的基础社会资源。其中值得提及最多的就是神龙计算平台,支撑了阿里巴巴经济体上云和外部大客户的全站上云,是阿里云IaaS层的核心创新产品。

640?wx_fmt=png

在2019年杭州云栖大会上,阿里云正式发布了第三代自研神龙架构。据悉第三代神龙架构支持ECS虚拟机、裸金属、云原生容器等,贯穿整个IaaS计算平台并在IOPS、PPS等方面提升5倍性能,用户能在云上获得物理机100%的计算能力。

2017年,一代神龙架构震撼现世,主要采用了自主研发的虚拟化2.0技术,兼具“虚拟机的心脏”和“物理机的肌肉”,被认为是云计算领域的新物种。如果仔细梳理神龙架构,我们发现很大程度上绕不开虚拟化技术的发展,甚至神龙可以被定义为是虚拟化技术的一个延伸。无论是从1974年第三代虚拟化架构的新时代要求,还是VMware公司成立等,真正把虚拟化带入应用阶段仅仅才刚开始,以前更多较倾向于理论研究。

640?wx_fmt=png

对此阿里巴巴研究员,阿里云智能创新产品线总负责人旭卿提及,2009年阿里云开始着手弹性计算,最早使用了开源的Xen;但经过几年的发展,就在2016年,众多从事基础IT的阿里人不禁反思:在云数据中心时代,究竟怎样的虚拟化技术可以满足日益增长的需求,毕竟几十年的虚拟化技术发展以来,但底层架构几乎未变。是不是可以做一些软硬融合或者软件硬件协同的创新来提高虚拟化的效率?毕竟传统物理机缺陷日渐凸显。

通常情况下,一台物理机中包含宿主机以及虚拟机,出现最多的情况就是资源“争抢”,这就会导致虚拟化效率的降低甚至频繁出现波动性。此外,云计算要配合虚拟化自然要消耗大量资源;想要做到效率高、性能佳,除了消耗大量的CPU资源之外似乎并没有更好的办法 ,相比之下成本激增就是个问题。所以在更高的计算性能、更快的网络接入,更高的存储读写能力的综合要求下,神龙就这样应运而生了。“我们重新定义服务器的架构,让它更好地服务今天的虚拟化技术,计算效率大幅度提升。”

640?wx_fmt=png

    

可以清晰地看到,发布以后2018年初神龙一代就实现全面商业化,在大规模在云上部署来主要满足大客户上云的需求。一代神龙之后,阿里方面发现,如果传统的虚拟化生产虚拟机和现在使用不一样的计算架构,就会带来两个资源池,成本大幅度上升。如何做到一套架构既可以支持裸金属服务,又可以支持传统的虚拟机,提供更高的服务质量,更好地支持容器,还能很好地兼顾成本、技术发展?在此背景下,真正让虚拟机在神龙架构下性能飞起来,FPGA毫秒级热升从中带来很大帮助,完成技术融合与资源并池,成为神龙二代的主要着力点。

640?wx_fmt=png

如今神龙三代已大成推出,主要集中在系统内部的优化部署,可以简单概括为芯片的硬化功能。有数据显示神龙架构和非神龙架构的业务吞吐会高30%,并且延迟保守不动,低负载和高负载完全一样;同时CPU利用率也会大幅度下降, 通俗来说原来需要一万台服务器完成的任务,现在只需几千台就可以,这就是神龙架构带来的最直观优势。

640?wx_fmt=png

目前神龙架构已经统一整体阿里云的计算资源产品,无论是ECS还是容器以及裸金属服务器等,整个平台所有的技术红利都因此被享受到。“接下来,阿里云遍布全球的百万服务器将全面升级至第三代神龙架构。” 小邪透露,在阿里巴巴内部,神龙架构已大规模应用于淘宝、天猫、菜鸟等业务,解决高峰值的性能瓶颈问题。

如今上云已不再是问题,不仅仅存在于外围系统,而是核心系统全栈上云,不断变化的是用户对计算的需求,首先就是最基础的弹性计算。例如更大的宽带、更小的延迟、绝对安全稳定、隐私的存储环境等。

640?wx_fmt=png

毋庸置疑,神龙架构将云计算的弹性得到最大强度释放,谈及阿里云针对弹性计算的实践,阿里云资深技术专家郑旭东表示,首先从阿里云弹性计算产品来说确实提供了非常卓越的稳定性。

据了解,阿里云提供单实例的SLA稳定性已经保证了99.975%,多实例稳定性则高达99.995%。这个数字代表什么含义?通常的服务器厂商、IDC厂商或者服务商,都不会轻易将SLA写到供货合同中。“我们公开SLA指标意味着线上的稳定性远高于SLA,目前ECS稳定性是线下IDC的稳定性的十倍之多。”

   

通常情况下提升稳定性除了非常巨大的资金和技术投入之外,回到服务的高可用和容灾这方面,达到业务的稳定性还需要扩大资源。例如,如果在一个机房内部运作高可用架构,资金投入量会随着资源使用量呈现线性增长的关系,其支出是条约的方式;除此之外在资源成本外还有很大一部分是研发成本和运维成本,但随着资源增多,其运维成本也呈现逐渐增长的过程。我们可以看到,在资源本身压力以及研发成本压力的作用下的,大多数中小型公司都知道要做各种各样的容灾以及高可用举措,但现实表现并不是特别理想。

在此背景下,阿里的ECS调度平台则能把底层OS和硬件缺陷规避很多,可以在X86平台服务器上提供远高于业界平均水平的技术服务,保障接近小型机的稳定性;试想一下如果有能力提供这样的稳定性,毋庸置疑弹性计算上大多数用户就都可以零成本且100%覆盖使用高可用服务。

    

具体来说为了达成该目标,郑旭东认为首先要有强健的基础设施,例如ECS服务器。据悉从研发设计到真正交付线上之前,至少有四轮非常严格标准的验证,保证线上所有服务器在整个业内是有保障的。“此外最重要的还是线上数据的回环,因为线上的监控数据和线下的压测平台是实时打通的,如果线上发现任何硬件异常或者隐患,我们会直接追踪并解决,这样就保证了大部分异常隐患都能在第一时间发现拦截并有效。”

据晶少了解,在异常隐患方面,阿里云弹性计算做了很多技术尝试来精准拦截故障,尽管在理论上依旧无法做到全部,但在预知与解决上收效甚广,这是整体系统稳定性所必需的具备的。举个例子,阿里弹性计算每一台物理机如果出现非预期的故障宕机后,5分钟之内80%的情况下能直接给出哪个代码、哪个部件出现问题而导致机器宕机的解决方案。其实故障预测非常复杂,很难用通路的算法得出结论。不同的场景会用不同的模型做不同的调度,最终得出合理的算法模型。强大的数据、算法知识以及团队合作等都很关键。

640?wx_fmt=png

除了稳定性外,在可靠性上有数据显示,早在2012年阿里云第一代云主机的PPS是20-30万每秒,绝大多数的性能损耗主要来自虚拟化过程,必须通过物理机连接网络,这样的速度基本没有办法支持峰值情况的速度提升;转眼到了2015年,通过硬件和软件的技术革新,阿里云将万兆网卡上的 PPS 从30万每秒提高到了120万每秒;待到2017年,阿里云通过用户态直通虚拟机,为每一次信息传输节省大量的时间,完成了原本无法想象的“450万每秒”。

如今随着深度学习算法的突破,人工智能技术得到了更迅猛的发展,以异构计算为代表的新加速计算单元不断催生大量计算类需求,在此发展趋势的作用下,阿里云正在不断增加新的实例,未来将会利用人工智能等先进技术在稳定性与安全性上持续深耕,并利用最新一代的网络技术保证产品性价比与性能稳定。

一直以来阿里云都将精力和时间放在最朴素的需求满足上,例如网络以及虚拟化技术的提升等,追求成本与功能的最高性价比,未来阿里云弹性计算技术创新以及产品研发风向如何?我们只需拭目以待。


640?wx_fmt=png

640?wx_fmt=png

640?wx_fmt=png

福利
扫描添加小编微信,备注“姓名+公司职位”,入驻【CSDN博客】,加入【云计算学习交流群】,和志同道合的朋友们共同打卡学习!

640?wx_fmt=jpeg

推荐阅读:
  • 漫画:什么是希尔排序?

  • 一次失败的面试,复习一次一致性哈希算法

  • Pandas中第二好用的函数 | 优雅的Apply

  • 程序员因接外包坐牢 456 天!两万字揭露心酸经历

  • 限时早鸟票 | 2019 中国大数据技术大会(BDTC)超豪华盛宴抢先看

  • 阿里开源物联网操作系统 AliOS Things 3.0 发布,集成平头哥 AI 芯片架构!

  • 雷声大雨点小:Bakkt「见光死」了吗?

真香,朕在看了!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/521526.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

支持Dubbo生态发展,阿里巴巴启动新的开源项目 Nacos

摘要: 上周六的Aliware技术行上海站Dubbo开发者沙龙上,阿里巴巴高级技术专家郭平(坤宇)宣布了阿里巴巴的一个新开源计划,阿里巴巴计划在7月份开启一个名叫Nacos的新开源项目, 在活动演讲中,坤宇介绍了这个开源项目的初衷&#xff…

地磅称重软件源码_电脑设备器件+塔吊主吊臂+撇渣管、丝杆+地磅称重传感器+极柱触头盒弯板+批式循环谷物干燥机+升降机标准节...

电脑设备器件 [1批]位置:广东省深圳市宝安区是否含税:不含税标的规格:批出险时间:2020-07-30 13:48:00受损原因:水湿深圳市益华市场受损程度:80%塔吊主吊臂 [1节]位置:广东省广州市番禺区是否含…

! [rejected]

git push -u origin master解决 git push -u -f origin master

laravel8找不到控制器_找一个“靠谱儿”的烟雾探测器方案,难不难?

安全,应该说是人们生活中最“硬核”的刚需。很多安全设备平日里几乎是“透明”的,大家感觉不到它们的存在,而一旦遇到事儿,它们却必须能够派上用场,颇有些“养兵千日,用兵一时”的味道。因此,如…

世界杯迄今最火的一场比赛 一文看懂世界杯背后的阿里云黑科技

摘要: 世界杯“法阿之战”中帕瓦尔世界波以及姆巴佩梅开二度一定让你印象深刻,而梅西的饮恨离开也让不少球迷碎了心。但你知道,比赛当天的阿里云藏着什么秘密吗?世界杯“法阿之战”中帕瓦尔世界波以及姆巴佩梅开二度一定让你印象深…

你在北边的西二旗被水淹没,我在东边的八通线不知所措

戳蓝字“CSDN云计算”关注我们哦!作者 | 朱小五and王小九责编 | 刘丹当代大城市年轻人,生活扇来的第一个巴掌就是——租房。而大部分年轻人在租房的第一年,要么付了大公司的服务费,要么交了黑中介的智商税。在积累了一定被坑的经验…

【免费公测中】为数据赋予超能力,阿里云重磅推出Serverless数据分析引擎-Data Lake Analytics

摘要: 近日,阿里云重磅推出Serverless数据分析引擎-Data Lake Analytics,Data Lake Analytics,帮助更多不具备分析能力的存储服务,赋予其分析的能力。近日,阿里云重磅推出Serverless数据分析引擎-Data Lake…

jq获取当前完整html,jquery怎样获取html的内容?

jquery怎样获取html的内容?下面本篇文章给大家介绍一下使用jquery获取html内容的方法。有一定的参考价值,有需要的朋友可以参考一下,希望对大家有所帮助。jquery获取html元素内容的方法方法1:使用html()方法html()可以设置或返回所…

内部矩阵维度必须一致simulink_深度学习/目标检测之numpy——向量和矩阵乘法相关...

numpy中表示向量和矩阵乘法的有四种"*"、outer、dot、multiply。1、关于 "*" 的用法"*" 也为对于元素的乘积,但是 "*" 作为乘法运算时,必须满足 numpy 的 broadcasting(广播) 的原则 ,当两个矩阵相乘…

阿里云企业IPv6部署方案

摘要: 一、什么是IPv6。 IP version 6 (IPv6)是IP协议(Internet Protocol)的最新版本,设计作为IP version 4 (IPv4) [RFC791]的继任版本。一、什么是IPv6。IP version 6 (IPv6)是IP协议(Internet Protocol)…

区块链应用@纸贵科技:基于阿里云容器服务护航内容版权

摘要: 区块链如何护航内容版权?区块链已经成为业界内外家喻户晓的一门技术,很多企业已经开始尝试将区块链应用于不同场景。目前,开源的Hyperledger Fabric区块链技术与容器技术的应用组合已成为一种经典的区块链方案,纸…

xbox one s驱动_续航800公里 体验6座SUV理想ONE

在新能源汽车产品日益完善的今天,越来越多的优质车型走进了我们的生活。续航能力一直是消费者们最关注的一个问题,为了缓解里程焦虑问题,高续航产品逐渐成为纯电动汽车的新消费主力。今天我们要聊的,就是一款新能源汽车大军中的生…

html添加子节点方法,HTML DOM appendChild() 方法

HTML DOM appendChild() 方法appendChild()方法的作用是:在指定父节点的子节点列表的末尾添加一个节点。如果给定的子节点是文档中现有节点的引用,appendChild()将它从当前位置移动到新位置(参见下面的“更多示例”)。使用insertBefore()方法可在指定的现…

靓仔落泪,性能问题定位难倒我了

戳蓝字“CSDN云计算”关注我们哦!作者 | popsuper1982责编 | 刘丹今天我的主题是在微服务场景下的一个性能问题的定位优化,那么今天会讲一个我们其实出现的一个真实的一个场景,然后其实还是花了蛮长时间,然后把这个东西才定位到一…

LC3视角:Kubernetes下日志采集、存储与处理技术实践

摘要: 在Kubernetes服务化、日志处理实时化以及日志集中式存储趋势下,Kubernetes日志处理上也遇到的新挑战,包括:容器动态采集、大流量性能瓶颈、日志路由管理等问题。本文介绍了“Logtail 日志服务 生态”架构,介绍…

RabbitMQ 添加用户(入门试炼_第2篇)

文章目录一、登录二、添加用户和角色2.1. 用户角色介绍2.2. 用户和角色分配2.3. 创建Virtual Hosts一、登录 二、添加用户和角色 2.1. 用户角色介绍 1、超级管理员(administrator) 可登陆管理控制台,可查看所有的信息,并且可以对用户,策略(…

如何查看一个组件的 classid是多少_如何查看iphone电池使用次数?6s电池容量多少需要更换?...

手机用久了之后,总感觉电池特别不耐用,特别是到了冬天,我相信很多人都会有种感觉,就是手机电池也越来越不耐用,待机时间变短,一天甚至需要三充。手机的电池确实和温度有关,但在使用一段时间后&a…

SLB访问日志分析:基于客户端来源和HTTP状态码的实践

摘要: 阿里云负载均衡SLB可以对多台云服务器(ECS)进行流量分发,支持TCP的四层负载均衡和基于HTTP/HTTPS的七层负载均衡。使用SLB可以降低单台ECS异常时对业务的冲击,提升系统可用性。同时,结合弹性伸缩服务…

android选择多个文件_一分钟合并多个Excel、PDF文件,3种方法任你选择,好用到没朋友...

一分钟合并多个Excel、PDF文件,3种方法任你选择,好用到没朋友前情提要:Excel、PDF多个文件怎样合并成一个文件?需求场景:PDF文件合并当一份完成的PDF资料分为很多份的时候,我们怎样将他们合并起来呢&#x…