冯诺依曼架构的 IO 鸿沟,谁能来填补?

作者 | 宋慧

头图 | 下载于视觉中国

随着AI技术、数据分析等领域兴起,数据变得越来越重要了,数据处理往往需要用到大量的内存,数据量爆发式增长让各种内存密集型应用层出不穷,如Redis数据库、SAP HANA企业核心系统。在CSDN 2019、2020年度的开发者调查数据中,有四成的开发者在数据收集和消息处理中采用Redis,并且比例在逐年上升。

不过现阶段的困境是,底层基础设施的发展却未能完全匹配数据爆炸的需求。

随着5G和网络性能的提升,计算存储网络三部分中的存储短板问题变得更加突出,内存的容量密度及速度与处理器的核数增长之间的差距越来越大,内存成为了短板。为了让机器得以处理更多的数据,部分企业只能扩大内存,而内存与CPU的配比有限,这又会造成CPU算力的浪费,昂贵的内存也会让企业面临更高的成本压力。

长久以来,虽然分级存储机制已经最大化平衡了各类存储介质的性能与成本要求,但业界对于新存储介质的探索一直未停歇。而在去年,阿里云推出了持久内存实例(简称re6p),更像是向冯诺依曼计算机体系中的终极梦幻存储方案迈进了一步。CSDN近日采访了阿里云ECS弹性计算产品团队负责人王志坤与阿里云持久内存型实例产品经理唐湘华,揭秘阿里云对持久内存实例的设计理念与对存储未来方向的理解。

冯诺依曼架构的难题:“内存墙”

过去近一个世纪,冯诺依曼架构构成了计算机科学的基础。在冯诺伊曼架构中,中央处理器(CPU)通过指令从内存中读取数据,并完成计算,再将数据返回内存保存。冯诺依曼理论模型的一个很重要的假设,就是计算与存储的速度相当。但是一旦出现不匹配,慢的一方会成为瓶颈。

如今,虽然数据量在猛增,但底层技术未能均衡发展。内存的容量密度及速度与处理器的核数增长之间的差距越来越大,内存发展速度跟不上计算核数的增长,内存成为的短板,这就是“内存墙”。

为此,不少企业用提升内存的方式对应对该问题。阿里云弹性计算为了满足客户需求也推出了大内存实例,比如阿里云最近推出了6TB 大内存的实例。然而,如前所述,这又会造成CPU算力的浪费,昂贵的内存也会让企业面临更高的成本压力。这并非长久之计,也难以规模化,需要从底层技术角度解决“内存墙”这个行业难题。

王志坤回忆,自己跟存储颇有渊源,自己在读博士的时候刚好就研究这一领域。“IO在整个计算机也好,服务器也好,一直是比较慢速的设备……冯诺依曼架构为什么有一层缓存系统?就是为了解决我们计算、内存和存储之间的性能鸿沟。”其实早在十几年前,学术界就在致力于研究存储领域的介质,来填补这个鸿沟。学术界和工业界都在寻找一种新型的存储介质,能够同时具备内存级别的性能,和硬盘对数据存储的持久性。

可惜,不少尝试都局限在实验室阶段,缺乏大规模商业化的可能性。

 

打破“内存墙”困境

 

直到这几年,阿里云发现了成熟的、可商用的产品——英特尔傲腾持久内存。该产品重新定义了传统的两级存储架构,性能和形态已经接近内存,而且同时也具备了存储的持久特性。腾傲持久内存与内存的IO性能几乎在相同数量级,但成本大大降低,几乎是为打破内存困境而生。

不过,要发挥这款产品的真正威力,需要非常高的技术能力,仅有少数技术领先的大型企业可以运用得当。阿里巴巴就是其中一家。阿里云启动了研发,希望能将这种能力产品化,让更多的企业低门槛地享受到技术红利。

最终,阿里云基于英特尔傲腾持久内存,赋予了其可为客户提供直接IaaS级云服务的能力,将内存非易失性这种颠覆性的存储架构特性带到了云上。阿里云持久内存实例产品经理唐湘华介绍,阿里云研发推出的持久内存实例提高了单条内存的容量密度,扩大了单颗CPU对应的内存容量,提高了CPU的利用率。持久内存实例应用会帮助用户打破“内存墙”藩篱,获得更高性能的同时,有效降低整体IT基础设施拥有成本(TCO)。

不过,任何IT新的技术从推出到企业级市场落地,企业用户只会用脚投票,拷问新技术与新产品的性价比。所以持久内存在初始期,必定是用来解决IT存储中的短板、最痛的那个问题。

关于持久内存实例的应用场景,阿里云从Redis缓存型数据库、SAP HANA这类典型的内存密集型应用入手,因为这些应用能够最直接地体现介质升级所带来的性能红利。不过唐湘华表示,阿里云团队正在更深入分析持久内存实例,例如在消息队列MQ的应用场景,可以大幅度地降低消息的长尾延时和业务抖动。除了作为内存的低成本替代品之外,腾傲持久内存也可以作为SSD来使用,在游戏前端、直播前端这些高负载、高并发的IO密集型应用中,持久内存实例想象空间将更加巨大,这也会是阿里云弹性计算的重点发力方向。

持久内存实例,从技术到产品

腾傲持久内存听起来具有如此巨大的优势,但所有新技术在早期较高的技术研发门槛,是让用户望而却步的主要原因。

从全球领域来看,很多传统服务器厂商也在推出持久内存产品,客户购置回来却很难直接使用。除了技术门槛,新介质与已有IT资源的兼容也是需要解决的问题。而云端的优势是用户可以随时随地享受到弹性计算的产品迭代、享受到最新的存储介质。同时,云厂商的多种付费模式,也会降低用户使用门槛。通过云厂商,用户可以非常低的门槛使用持久内存,应用于自身的业务,而这几乎是所有企业级生意的最佳切入模式。

所以当业界还在讨论持久内存与DRAM性能对比、持久内存适用的场景和用例时,阿里云已经正式推出了基于英特尔傲腾持久内存的产品。不过,全球知名的云计算厂商有很多,为什么是阿里云,成为全球率先推出商业化的持久内存实例的云服务商?这是更有趣的问题。

作为推崇技术普惠宗旨的云计算厂商,阿里云既是最贴近用户一方需求的技术资源提供者,也是将高深技术规模化商用、降低技术门槛的变革者。

王志坤认为,阿里云的体量与规模发展到一定阶段,在服务客户过程中看到了客户的诉求,原来的大内存实例十分昂贵,无疑是不符合云计算的普惠原则。不过,在云端将持久内存规模化提供给用户,对技术能力的要求是非常高的。

纵观阿里云的架构,除了有自主研发“神龙”云服务器架构之外,还有“飞天”云操作系统、“盘古”存储平台、“洛神”网络平台、PolarDB云原生数据库等等,构成了统一的云平台,让阿里云具备了从虚拟化层到操作系统内核层全链路的整合与调优能力。这些能力最终使得阿里云弹性技术团队对持久内存的产品化研发变得更加敏捷。

“阿里云所有的弹性计算产品全部是基于神龙架构的。我们所有的虚拟化工作,得到了极大简化,我们整个飞天云操作系统底层的很多工作,都是由我们神龙芯片来完成的。这也大大提升了引入AEP这种新型存储介质对于整个产品迭代演进的速度。”王志坤表示。

阿里云全面融合了英特尔持久性内存的产品特性,在Redis数据库中,阿里云从虚拟化层到操作系统内核层,全链路进行了优化加速。

在应用层的优化中,Redis缓存型数据库,是典型的KV数据结构,在持久内存和普通内存同时存在的系统中,尽量将Redis的索引数据放到DRAM(动态随机存取存储器,即原来的内存)而将用户数据放到持久内存中。动态阈值管理数据分布,既可以保证较小的索引数据尽量放到内存中,又可以保证普通内存和持久内存符合一定的容量比列。同时对于一些生命周期较短并频繁访问的数据,阿里云会通过优化将其放置到普通内存中。利用此方法阿里云持久内存实例的性能可以非常接近于DRAM。

而在内核层面,阿里云持久内存实例搭载了阿里云官网操作系统Aliyun Linux,针对Redis应用,阿里云从内存锁操作、进程fork流、内存合并等Redis应用数据流处理及管控关键技术节点上,进行了针对性的优化设计。让运行在持久性内存实例上的Redis数据库读写性能相对于运行在开源Linux操作系统上的性能提升20%以上。

附:阿里云持久内存实例的性能与收益:

  • 性能大幅提升:在Redis等内存型数据应用中,经过阿里云全链路优化,性能相对于运行在开源Linux操作系统上提升20%以上;

  • 超大内存配比:提供1:20超大内存容量配比,更低的价格,更大的内存容量;

  • 断电数据不丢:机器断电数据不丢失,重载速度最快提升高达12倍以上。

未来:存储介质界限模糊,走向软硬一体

就在刚刚过去的2020年底,英特尔的傲腾持久内存已经发布至第二代了。从磁带、磁盘、闪存再到持久内存,存储介质的性能与成本在持续向前迭代演进。每一代存储介质均是逐步退出舞台中央,去承担更低性能的存储归档数据的职责。

阿里云两位专家认为,未来无论介质抑或是产品层面,内存和传统存储的界限在不断趋于模糊,各类存储介质将是长期并存的状态。同时,随着IOT、5G的兴起,数据的量级将继续增大,人们对于数据的访问、检索、处理的要求将越来越高,IO密集型应用也会促使超高性能的存储设备更加广泛地被使用。

从更广阔的角度看,IT系统从硬件主导,进入了云计算的软件定义时代,但在阿里云专家看来,未来软件与硬件不再是IT的两个对立面,阿里云从神龙架构和芯片开始,已经走向软硬一体的下一个时代。软硬一体化将让阿里云作为一个整体去接纳新的介质、新的技术,提升迭代速度。

5G、人工智能的普及,数据量爆发式增长,让数据的流动与应用变得更加普遍,对海量数据的快速处理将是一切人工智能创新的基础。未来,阿里云在AI、大数据等方向对软硬一体化、芯片化的探索,仍将不停向前。

点击关注我们,记得标星哦~~~

更多阅读推荐

  • 5G 流量单价两年降 46% 热议背后,5G 如何解锁商业新模式?

  • SRE 是如何保障稳定性的

  • 如何写出让 CPU 跑得更快的代码?

  • 俯瞰云原生,这便是供应层

  • 13种重要的云原生工具,让交付过程更快

  • 一目了然的 Docker 环境配置指南

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/515476.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

使用Git后10件你可能需要“反悔”的事

云栖号资讯:【点击查看更多行业资讯】 在这里您可以找到不同行业的第一手的上云资讯,还在等什么,快来! Git是目前世界上最优秀最流行的分布式版本控制系统,也是程序员们日常使用最频繁的工具之一(几乎每天都…

SpringBoot 整合MongoDB

文章目录1. 引入依赖2. 在yml中添加配置3. 在启动类中开启mongodb在model中添加依赖&#xff0c;为什么在model中添加&#xff1f;因为会有映射的实体类MongoObject对应mongodb中的数据表对象&#xff1a;1. 引入依赖 <dependency><groupId>org.springframework.b…

浏览器从输入URL到页面渲染过程 ——页面渲染流程

之前我有总结过一篇经典面试题&#xff1a;浏览器从输入URL到页面渲染过程 &#xff0c;接下里我将对某些知识点进行更细致的解析。 浏览器从输入URL到页面渲染过程 系列文章&#xff1a; &#xff08;一&#xff09;&#xff1a;浏览器从输入URL到页面渲染过程 —— 浏览器的…

阿里发布2020农产品电商报告数字农业将成风口

完美日记创立于2017年&#xff0c;这家公司上线不到两年即成为天猫彩妆销冠&#xff0c;2019年成为11年来第一个登上天猫双十一彩妆榜首的国货品牌&#xff0c;包揽天猫2019全年彩妆销冠&#xff1b;2020年4月成为首个亮相天猫超级品牌日的国货彩妆品牌&#xff0c;同时勇破彩妆…

【干货】和你谈谈数据分析报告

前言&#xff1a; -更多关于数智化转型、数据中台内容请加入阿里云数据中台交流群—数智俱乐部 &#xff08;文末扫描二维码或点此加入&#xff09; -阿里云数据中台官网 https://dp.alibaba.com/index &#xff08;作者&#xff1a;数智从业者&#xff09; 在当今企业纷纷推动…

Vue3 安装axios使用报错:Uncaught TypeError: Cannot read property ‘use‘ of undefined

最近在学习Vue3&#xff0c;使用vue cli4搭建了一个demo项目&#xff0c;安装axios后&#xff0c;控制台报错&#xff1a; Uncaught TypeError: Cannot read property use of undefinedat eval (axios.js?be3b:59)at Module../src/plugins/axios.js (app.js:1229)at __webpac…

云原生五大趋势预测,K8s安卓化位列其一

作者 | 李响、张磊 Kubernetes 本身并不直接产生商业价值&#xff0c;你不会花钱去购买 Kubernetes 。这就跟安卓一样&#xff0c;你不会直接掏钱去买一个安卓系统。Kubernetes 真正产生价值的地方也在于它的上层应用生态。 “未来的软件一定是生长于云上的”&#xff0c;这是…

centos7 linux 安装 keeplived

文章目录一、简介部署总览1. 简介2. 部署总览二、安装实战2.1. 安装环境2.2. 下载软件包2.3. 同步软件包2.4. 解压、编译、安装三、系统服务3.1. 配置复制3.2. 脚本复制3.3. 服务开机启动四、配置修改4.1. 编辑配置4.2. 140 服务器配置4.3. 141 服务器配置4.4. 启动keepalived4…

阿里人脸识别安全技术获专利可防范3D人脸面具攻击

云栖号资讯&#xff1a;【点击查看更多行业资讯】 在这里您可以找到不同行业的第一手的上云资讯&#xff0c;还在等什么&#xff0c;快来&#xff01; 当人脸识别遇上3D技术&#xff0c;谁将是最后的胜利者?长期困扰人脸识别行业的安全问题有了最新的解法。日前&#xff0c;阿…

vue3中 使用 swiper 插件,自定义切换按钮, 将 前进后退 、左右切换 按钮放到容器外部

今天在使用 swiper 时&#xff0c;遇到一个 坑爹的 问题。 swiper 组件的本来样式长这样&#xff1a; 左右切换的按钮在滑动容器内部&#xff0c;但是我们想要它跑到容器外面去。 网上找了一堆方法都不好使 也不知道是不是因为 我使用的是 高版本原因 最终实验结果&#x…

一眼看尽5G江湖,Gartner发布5G网络基础设施魔力象限报告

作者 | 白告天来源 | 边缘计算社区头图 | 下载于视觉中国近日&#xff0c;国际权威分析机构Gartner发布了首份《通信运营商5G网络基础设施魔力象限》报告。以最直观的方式展示了这一领域内各家头部企业的力量对比情况。Gartner通信运营商5G网络基础设施魔力象限该魔力象限帮助通…

一篇小文带你走进RabbitMQ的世界

云栖号资讯&#xff1a;【点击查看更多行业资讯】 在这里您可以找到不同行业的第一手的上云资讯&#xff0c;还在等什么&#xff0c;快来&#xff01; 说到消息中间件&#xff0c;大部分人的第一印象可能是Kafka。毕竟Kafka自问世以来&#xff0c;就顶着高并发&#xff0c;大流…

nginx高可用方案:keepalived+nginx vip 动态位移

文章目录一、部署总览常用命令1. 部署总览2. 常用命令二、软件安装配置2.1. 安装keepalived2.2. 安装nginx2.3. 配置静态文件三、测试3.1. 启动nginx3.2. 验证四、vip动态位移测试4.1. 140验证4.2. 141验证4.3. 140停止kp服务4.4. 141 验证4.5. 140 重新启动kp服务一、部署总览…

多角度分析平台即服务?PaaS的类型和用例

云栖号资讯&#xff1a;【点击查看更多行业资讯】 在这里您可以找到不同行业的第一手的上云资讯&#xff0c;还在等什么&#xff0c;快来&#xff01; 没有适合所有人的单一PaaS。即使云计算已经发展了10多年&#xff0c;但对云计算服务模型的定义仍然相当模糊。通常&#xff0…

未来,边缘计算的功能支柱是 Kubernetes

来源 | SDNLAB责编 | 寇雪芹头图 | 下载于视觉中国编者按在数字化转型时代&#xff0c;5G网络是一个飞跃。5G正在推动边缘计算的发展&#xff0c;而Kubernetes则是5G与边缘计算之间的粘合剂。云计算的十年云计算之于信息技术(IT)产业&#xff0c;就像石油之于汽车工业一样。云让…

如何在工作中快速成长?致工程师的10个技巧

云栖号资讯&#xff1a;【点击查看更多行业资讯】 在这里您可以找到不同行业的第一手的上云资讯&#xff0c;还在等什么&#xff0c;快来&#xff01; 作者 | 江建明 阿里巴巴高级无线开发专家 导读&#xff1a;精英人数的增长速度持续加快后&#xff0c;很多人开始焦虑&#…

在新项目中使用 Vue3 使用总结

一、使用背景 最近公司需要搭建一个新项目&#xff0c;用于做官网。因为作为官网&#xff0c;首先项目不算大&#xff0c;一共只有十来个页面&#xff0c;并且想要用户体验感很好&#xff0c;所以最终选定以 Vue 作为技术栈。 虽然 Vue3 &#xff08;中文官网&#xff09;刚问…

2020年从架构谈起到Mesh结束

作者 | 张羽辰&#xff08;同昭&#xff09;阿里云交付专家 导读&#xff1a;如今&#xff0c;几乎所有的事情都离不开软件&#xff0c;当你开车时&#xff0c;脚踩上油门&#xff0c;实际上是车载计算机通过力度感应等计算输出功率&#xff0c;最终来控制油门&#xff0c;你从…

Mendix:低代码平台四大常见用例开发

编辑 | 宋慧 供稿 | Mendix 头图 | 付费下载于视觉中国 如今&#xff0c;低代码对很多人来讲可能已经不再是一个陌生的名词。创新的低代码开发平台实现了低级别编码的抽象化和人工流程的自动化。低代码通过可视化开发工具和可重用组件&#xff0c;缩短了定制化网络和移动应用的…