聊一聊并行文件系统的客户端优化之道

并行文件系统作为文件存储的一个高性能分支,自出现以来已经走过了二十个年头,一直被大规模应用于气象预测、石油勘探、高能物理、汽车制造、芯片制造、自动驾驶、影视渲染等高性能计算领域。在AI时代下,GPU并行计算如火如荼,阿里云CPFS也正式演进到了2.0时代,并且对传统并行文件系统的技术体系有了一系列创新和实践。

一、并行文件系统的演进之路

传统的并行文件系统诞生于二十一世纪初的CPU+物理机时代,直到二十一世纪的第二个十年的到来。2012年,Alex Krizhevsky(前谷歌计算机科学家)利用深度学习+GPU的方案,一举赢得Image Net LSVRC-2010 图像识别大赛,并奇迹般地将识别成功率从74%提升到85%。GPU从此一战成名,凭借自身海量流处理器和矢量处理单元成为了AI计算的首选加速器。GPU芯片的算力从V100到A100再到H100,实现了成倍的增长,对数据吞吐量的需求也成倍增长,甚至一度超出了PCI-E总线的能力。

与此同此,随着容器K8S平台的逐渐成熟,AI训练的运行平台已经由过去的虚拟机+物理机转向为容器+云计算平台。这样的时代背景下,传统的并行文件系统也面临了极大的挑战。

本系列文章会从以下几个方面,与大家分享阿里云CPFS是如何应对这些挑战以及对并行文件系统的技术探索与落地实践:

  • 从专属客户端到NFS标准协议服务
  • 从文件存储自闭环到拥抱云上数据湖的开放生态
  • 从CPU大文件计算到GPU小文件计算
  • 快、再快一点---服务端缓存和计算端缓存的进化

本期我们会具体介绍CPFS在客户端侧的轻量化变革。

二、专属客户端的问题所在

众所周知,由于世纪初NFS等通用协议的不完善,传统的并行文件系统都设计并提供了专属客户端,可以说专属客户端是高性能并行文件系统的身份象征。

专属客户端是并行文件系统实现高性能的重要组成部分,专属客户端对于并行文件系统至关重要,不仅提供了MPI-IO接口、多后端服务器连接能力、负载均衡能力,部分专属客户端还可以提供单机数据缓存能力。但是随着容器时代的到来,专属客户端显示出了他的诸多问题:

  • 首先,重客户端多采用内核态,这就引起与操作系统深度绑定。在世纪初,专业的HPC应用有限,多为专业公司开发并运行于超算中心,重客户端看起来不是个问题。但是随着AI时代的到来,GPU应用开发百花齐放,开发者习惯不同,限制操作系统或内核版本变成了一个巨大的门槛。
  • 其次,弹性容器带来极速的应用部署能力和弹性扩缩容能力,将计算资源利用率提升至极致。专属客户端较慢的部署速度和较多的软件依赖,降低了应用部署速度,限制了容器的弹性能力。
  • 再次,面向应用的数据管理取代面向物理机的数据管理。容器时代,用户业务的使用界面从物理机和虚拟机上移至应用,重客户端将整个文件系统视为统一的命名空间,只能通过传统的ACL方式进行复杂权限配置,且无法通过动态和静态PV和容器K8S实现联动,实现容器内应用访问数据的完美隔离。

三、轻量化NFS客户端的新思路

要解决专属客户端的问题,就需要对客户端进行“瘦身”,实现NFS协议端的轻量化。通过操作系统解耦,让所有Linux系统都可以轻松使用CPFS,解放开发者,其次,发挥分布式文件系统的高性能优势,最后,实现K8S弹性PV,以及PV间严格数据隔离,具体方式包括以下三个方面:

1、基于NFS协议实现轻量化端接入

NFS是文件存储领域使用最广的协议,具有成熟的通用型、易用性,为广大使用者接受。为了降低CPFS的使用门槛,CPFS需要兼容NFS。

传统的并行文件系统重客户端往往指定操作系统、内核版本,内核版本升级后客户端还需要重新安装,运维成本高,而CPFS-NFS客户端是用户态的,不依赖内核版本,这带来两个好处:一是支持所有主流操作系统,CPFS-NFS客户端支持Alibaba Cloud Linux、CentOS、Ubuntu、Debian等,二是当用户操作系统升级后,CPFS-NFS客户端无需升级可继续使用。

传统的并行文件系统客户端需要复杂的配置才能达到较好的运行效果,例如Lustre需要对网络组件LNET、元数据组件MDC、数据组件OSC进行并发度、块大小等配置,增加了用户的维护成本。CPFS-NFS客户端使用简单,只需要一条mount挂载命令即可,客户端的默认配置由CPFS-NFS客户端自行完成,降低用户使用门槛。

并行文件系统通常将文件系统逻辑上移到客户端上完成,例如Lustre的OSC需要感知文件分片(stripe)位于哪些存储服务器才能读取数据,这增加了客户端上CPU、内存的资源开销。CPFS-NFS客户端的资源开销是轻量的,只用于传输数据和必要的元数据操作,CPU开销通常小于一个逻辑核。

2、优化协议实现保证端接入的高性能

借助CPFS并行I/O、全对称的分布式架构提供的底座能力,NFS协议端同样具有高吞吐、高IOPS的集群性能,远超传统NAS单机架构带来的性能指标。例如200MB/s/TiB规格下,NFS协议端也提供每TiB容量兑付200MB/s吞吐的性能指标,最大吞吐是20GB/s,最大可接近100万 IOPS。

NFS协议服务组成协议集群,根据CPFS文件系统容量同步横向扩展。CPFS-NFS客户端与协议节点之间具备负载均衡的能力,在客户端挂载时可根据协议节点负载(连接数、空闲带宽、CPU等)选择最佳的协议节点建立连接,有效的避免热点、胖客户端挤兑单个协议节点带来的性能下降。

3、提供多种挂载方式大规模挂载的支持与目录级挂载点

为了满足K8S弹性PV的需求,同时实现PV间严格数据隔离,CPFS支持了多种挂载方式,具体包括:

  • 大规模容器挂载

传统的并行文件系统客户端上通常会保存状态,这导致客户端规模有限,例如客户端上保存打开的文件、读写锁等状态,为保证数据一致性,客户端之前互相做状态的颁发、召回等操作。客户端规模越大,客户端之间的交互、消耗的资源更多,这限制了客户端的规模。

CPFS-NFS客户端是无状态的,客户端只与存储节点连通,不会随客户端规模增大而加重客户端的负载。CPFS-NFS客户端支持10000个客户端/POD同时挂载访问数据。

  • CSI插件,支持静态、动态卷

CPFS-NFS客户端与阿里云容器服务(ACK)深度集成,CSI 支持静态存储卷挂载和动态存储卷挂载两种方式挂载 CPFS存储卷。详情见CPFS静态卷,CPFS动态卷。

  • 目录级挂载点

目录级挂载点提供端上访问隔离的能力,容器挂载时仅挂载子目录,防止容器应用直接访问整个文件系统,引起数据安全问题。通过使用Fileset和ACL,CPFS能提供更强的目录隔离:后续Fileset支持配额,可配置目录子树的文件数量、总容量;ACL可配置用户的访问权限。

总结

目前,CPFS的标准NFS协议访问模式已经开放。帮助一些原有因为操作系统版本原有无法使用云上CPFS的客户实现了业务弹性上云。同时,结合阿里云容器ACK服务,为客户提供了秒弹几百个POD的动态伸缩能力,实现了忙时快速扩容,闲时快速释放,降低GPU资源闲置成本。

文件存储CPFS在支持NFS协议上的能力的重要提升,意味着无论是容器还是虚拟机,无论是哪种Linux版本,都可以轻松访问高性能的CPFS并行文件系统,这无疑有助于加速自动驾驶场景落地。欲了解更多,可移步
https://yqh.aliyun.com/live/detail/28624预约直播。

后面,我们还会继续分享CPFS在数据湖生态融合、小文件计算、缓存技术等方面的技术进化,希望能持续关注此系列文章。

原文链接

本文为阿里云原创内容,未经允许不得转载。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/510793.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

马斯克“灭霸式”裁员,多个部门遭“团灭”!结果火速打脸,开始“跪求”被裁工程师复职?...

整理 | 郑丽媛出品 | 程序人生(ID:coder_life)“为了使 Twitter 走上健康的道路,我们将在周五经历裁减全球员工的艰难过程。我们清楚,这势必会影响到一些为 Twitter 做出宝贵贡献的人,但不幸的是&#xff0…

辛辛苦苦原创的网站,被抄袭了怎么办?

几个月前,某公司A针对网站被恶意抄袭发布了一则严正声明。A公司是一家网站设计公司,该公司网站精巧的设计、美观的排版,总会让人眼前一亮。可某天A公司却发现,另外一家B公司在没有任何授权的情况下,其网站照搬了A公司网…

IT人才能嗑到的这对CP,甜!

提到文件存储,相信大家都不陌生,在浩瀚的存储发展史中,文件存储无疑是璀璨的,耀眼的。那么,在性能已经成为刚需,自动驾驶行业风起云涌的当下,文件存储与GPU这对CP又有怎样的含糖量呢&#xff1f…

走进施耐德电气中国软件研发中心,读懂软件创新推动“双转型”

低碳发展和数字化的“双转型”挑战下,施耐德电气认为,软件将成为企业增长的强力引擎——软件能够打通产品、生产、运营和资产的各个环节,实现全生命周期管理,让数据“可视、可管、可控、可用”,促进整个产业链实现从设…

PolarDB-X 2.1 新版本发布 让“MySQL 原生分布式”触手可及

PolarDB-X 2.1 新版本发布 让“MySQL 原生分布式”触手可及 ——黄贵(曲山)阿里云数据首席架构师 了解更多PolarDB-X 内容: https://developer.aliyun.com/topic/polardbx_release PolarDB-X 2.1 是 PolarDB-X 非常重要的版本&#xff0c…

PolarDB-X 高可用存储服务:基于 X-Paxos 一致性协议

了解更多PolarDB-X 内容: https://developer.aliyun.com/topic/polardbx_release 一、DN 高可用方案 在 PolarDB-X 的系统结构中,DN 组件负责数据存储。 一个 DN 节点是 一个 MySQL 实例。 为了数据安全,我们需要多副本,一个逻辑…

奋战开源操作系统二十年:为什么编程语言是突破口?

【编者按】编程语言之于操作系统,意味着什么?本文作者飞漫软件创始人魏永明经过二十余年的操作系统开发探索,明确提出编程语言是自主基础软件,尤其是操作系统的重要抓手。如果说操作系统是基础软件生态里的皇冠,那编程…

一站式智能运维解决方案,企业系统的隐形守护者

时有爆发的疫情,加速引导着用户观影方式的改变。越来越多的用户习惯将观影模式从线下转移到线下。 疫情作为电影行业的“黑天鹅”,让线下影院陷入沉寂,但是却让网络视频平台焕发新生。多家视频平台公布了2022财年Q4的财报,其用户…

事务、全局索引、透明分布式,再见,分区健

事务、全局索引、透明分布式 再见,分区健! ——陈默(墨城)阿里云数据库技术专家 了解更多PolarDB-X 内容: https://developer.aliyun.com/topic/polardbx_release 在刚刚发布的PolarDB-X 2.1.0版本中,开…

坚不可摧!腾讯安全设三道防线,一站式护航云上安全

数字经济时代催生了企业的“云”化发展,随着业务规模的迅速扩大,混合云和多云的部署日益增多,随之而来的各类漏洞和威胁让企业的安全防护门槛和复杂度越来越高。 据腾讯安全发布的《2021年度公有云安全报告》显示,2021年腾讯安全…

好的 MySQL 兼容性可以做到什么程度? PolarDB-X 如何做生态兼容

好的 MySQL 兼容性可以做到什么程度 PolarDB-X 如何做生态兼容 ——吴学强(燧木)阿里云数据库高级技术专家 了解更多PolarDB-X 内容: https://developer.aliyun.com/topic/polardbx_release 众所周知,数据库是基础的软件系统&…

如何「场景化」的企业上云

随着“十四五”规划正式提出“以混合云为重点培育行业解决方案、系统集成、运维管理等云服务行业”,混合云成为产业内众多服务商和企业关注的重点。自混合云概念出现以来,已有超过十年的历史。初期的混合云基本只是云环境之间的简单连接,其能…

Serverless JOB | 传统任务新变革

Job 作为一种运完即停的负载类型,在企业级开发中承载着丰富的使用场景。SAE Job 将 Serverless 技术所带来的普惠红利从应用领域向外延展至任务领域,通过结合 longrun shortrun 的使用场景和最佳实践打造成为 Serverless 一体化企业级开发运维平台&…

最全!即学即会 Serverless Devs 基础入门(上)

在上篇《即学即会 Serverless | 如何解决 Serverless 应用开发部署的难题》中,我们阐述了工具链的重要性,那么本文将带领各位快速实现 Serverless Devs 入门。 安装工具 第一步:请先安装 Node.js(>10.8.0) 与 NPM 包管理工具&#xff1b…

阿里云ODPS入选2022世界互联网领先科技成果

11月9日,2022年世界互联网领先科技成果发布活动在世界互联网大会乌镇峰会期间举办,评选出具有国际代表性的年度领先科技成果,由阿里云自主研发的大数据智能计算平台ODPS入选。ODPS解决了超大规模多场景融合下,用户多元化数据的计算需求问题&a…

最全!即学即会 Serverless Devs 基础入门(下)

在上篇《最全!即学即会 Serverless Devs 基础入门》中,我们阐述了工具链的重要性,并对安装方式 & 密钥配置进行了讲解。但是在 Serverless Devs 的规定中,一个 Yaml 可以被认为是一个 Serverless 应用,因此本文将继…

全球创见者共话企业韧性 金蝶“数字员工”惊艳亮相

11月11日,由云南省昆明市人民政府、云南省工信厅指导,金蝶集团主办的“2022全球创见者大会”成功举办。大会以“数治企业 韧性成长”为主题,求索不确定时代,如何以“数”治企,用EBC治理和管理企业,实现韧性…

开箱即用!Linux 内核首个原生支持,让你的容器体验飞起来!

容器化是最近几年 DevOps 界流行的趋势,通过业务的容器化我们将创建一个完全打包、自包含的计算环境,让软件开发人员能够更加快速地创建和部署自己的应用程序。然而长期以来,由于镜像格式的限制,容器启动镜像的加载是很慢的&#…

专访快准车服CIO牛小虎:全面信息化支持,让车爱上快准

一、紧跟创业浪潮,年轻的快准团队走在前列 1999年11月,第五届中国国际电源展览会和第二届中国电子变压器展览会在广州成功举办,近150家企业的电源及电子变压器产品争相亮相,这样中国电源产业看到了广阔的前景与市场空间。 电源产…

元宇宙照进现实 金蝶联手科大讯飞发布“数字员工”

“金小蝶,请帮我查一下这个项目资金占用的情况。” 企业管理者话音刚落,包括损益分析、回款分析、资金占用分析等详尽的数据结果便已呈现在其眼前,同时还针对资金异常情况给出了风险评估。在一问一答中,销售总监得到了一个得力的“…