XSKY对象存储深度结合Alluxio分布式缓存系统,GPU利用率提高至90%以上

在这里插入图片描述
近日,Alluxio分布式缓存系统完成了与XSKY星辰天合的 XEOS V6.4 对象存储的兼容性测试,旨在解决数据管理和加速方面的挑战。双方进行了深度的产品对接和联合开发,将 Alluxio 分布式缓存系统与 XEOS 对象存储的众多应用特性进行结合,推出一体化存储联合方案,以更好地支持 AI 场景下的数据管理和加速需求。在这里插入图片描述
近年来,随着 AI、大数据的逐渐推广和完善,特别是 AI 大模型(LLM、多模态、文生视频等)的广泛推广,超大数据量的存储以及访问已经成为了企业面临的一个重大的技术以及成本挑战。

对象存储具有扩展性好、安全性高、成本可控等特点,成为了目前最热门的海量数据存储技术选型。但是对象存储在数据访问性能方面也面临一系列挑战,特别在 AI 模型训练场景下,数据访问性能的增强,成为了提升 GPU 利用率的关键因素,市场亟需一个能够和对象存储有效结合,兼具对象存储优势且性能卓越的一体化解决方案。

Alluxio 数据平台与 XEOS 的这一合作将为用户提供更高性能、更低成本、更灵活的数据管理和加速方案,有望推动 AI 技术在各个领域的应用和发展。

Alluxio Enterprise AI 与XEOS强强联合

针对 AI 场景的数据平台 - Alluxio Enterprise AI

Alluxio Enterprise AI 是针对 AI 相关场景的数据平台,可在本地、云、混合或多云环境中,支持无缝访问、管理和运行您的数据和人工智能工作负载。

在这里插入图片描述

  1. 智能缓存能力:Alluxio 推出的 Alluxio Enterprise AI 平台可以提供高性能分布式缓存系统,因此 AI 引擎等计算应用可以通过访问高性能 Alluxio 缓存提高数据 I/O, 而非相对缓慢对象存储来读写数据。其智能缓存策略针对 AI 等工作负载的 I/O 模式量身定制,可为整个 AI 等计算工作流提供高吞吐量和低延迟。Alluxio 可将 GPU 利用率提高至90%以上,使得数据与 GPU 周期同步,并加速模型训练和模型服务。
  2. 无需数据拷贝:Alluxio 可快速按需加载数据,而非将数据复制到本地存储。这消除了数据加载对计算性能造成的瓶颈。通过高性能的按需数据访问,可消除数据副本并提高性能。
  3. 节约成本:Alluxio 可以结合实际计算需要进行灵活的贴近计算侧的部署,充分利用闲置资源提供透明的数据访问加速能力,以提升计算侧的 GPU/CPU 利用率,用较少的成本达到更好的效果。
  4. 无需重写应用程序:Alluxio 通过统一的命名空间对数据技术栈进行标准化,跨各类存储系统提供统一的访问模式,可以提供 S3/HDFS/POSIX/RESTful 等各种 API 能力。应用开发人员无需再考虑数据存储的位置,可以解耦计算和存储,而无需重写应用程序。

为海量非结构化数据而生的XEOS 对象存储

XEOS 是 XSKY 推出的企业级对象存储产品。它支持无缝扩展、跨异构存储系统的统一管理、高性能访问、智能数据管理等功能,帮助企业轻松构建安全可靠、高性能、低成本的对象存储平台,满足日益增长的海量数据管理需求。
在这里插入图片描述
XEOS 作为全面的对象存储解决方案,是数据湖的理想底座,特别适用于 AI 场景的数据存储和管理。作为数据湖的底层存储,XEOS 具备以下优势:

  1. 无限扩展能力:XEOS 支持分布式元数据和存储节点,可以轻松扩展到千亿级别的对象存储容量,满足海量数据积累的需求;
  2. 高性能访问:统一的元数据服务、智能多级缓存等技术确保了快速的数据访问性能,满足数据湖中各类应用的需求;
  3. 强大的数据管理功能:XEOS 提供了丰富的数据生命周期管理、存储分级、压缩等功能,有效提高了存储效率和性价比;
  4. 卓越的数据安全:XEOS 采用 EC、副本、故障域等机制,以及加密、快照、回收站等技术,确保数据的持续高可用和安全性;
  5. 智能生态支持:XEOS 与大数据、机器学习等应用高度融合,提供了图形化工具、自定义元数据、数据流动等功能,有助于构建端到端的数据智能应用。

XEOS 与 Alluxio 深度结合 充分利用二者优势的联合方案

XEOS 与 Alluxio 的融合充分利用了 XEOS 和 Alluxio 的能力,实现了更高性能、更低成本、更灵活的数据管理和加速方案。在完成两款产品的基础融合后,双方不仅仅完成了基本功能的验证,还基于 AI 场景探索 Alluxio 与 XEOS 进行深度结合开发。

1.高并发、高性能元数据操作

Alluxio 和 XEOS 进行了元数据接口的深度集成和调试,实现了百亿到千亿级对象基础上的高性能数据请求,支持数百万级高性能低时延 IOPS。

XEOS 提供了分布式元数据服务能力,Alluxio 提供了无状态可扩展的元数据存储和服务能力,都保证了良好的扩展性,同时 Alluxio 和 XEOS 在元数据相关接口集成上有效降低了非必要的接口调用以及非必要的数据传输,大大提升了元数据接口之间的交互性能。

通过 Alluxio 的无状态扩展性,每个 Alluxio 节点独立支撑相当数量的元数据的请求以及缓存,利用 XEOS 自身的高性能元数据访问接口能力,在不损耗元数据请求性能的基础上扩展元数据服务支撑能力,特别是在海量小文件的高并发数据请求下,既可以降低高并发元数据请求对 XEOS 的压力,又能大大提升元数据请求的服务性能。

2. 缓存精准实时更新

Alluxio 和 XEOS 之间可以充分利用 XEOS 提供的数据集消息通知能力。当 XEOS 感知到数据发生变更时,会实时推送通知给 Alluxio。Alluxio 可以利用消息通知机制,精准快速地决定哪些数据需要被预热到缓存中。

在这里插入图片描述

这种基于消息通知的缓存预热机制,能够确保 Alluxio 缓存的实时性和准确性。应用程序无需人工干预,Alluxio 就能自动感知数据变化,快速完成缓存的更新和预取,大幅提升缓存的时效性,保障了数据访问性能,大大降低预热对计算的影响。

这种深度融合不仅提高了缓存的命中率,还最大限度地减少了不必要的数据移动,大大优化了整体的 I/O 性能和资源利用效率。通过 Alluxio 与 XEOS 的协同,AI 应用可以获得卓越的数据访问体验。

3.更高效的数据写入能力

XEOS 提供的追加写和随机写能力,与 Alluxio 缓存层的数据写入能力可以实现高度融合,提供更高效的数据写入能力。

XEOS 作为 Alluxio 的持久化存储层,不仅提供了海量的存储容量,还支持丰富的写入模式,如追加写、随机写等。Alluxio 可以充分利用 XEOS 的这些写入功能来优化缓存写入功能和性能。对于需要频繁更新的热点数据,Alluxio 可以直接以追加写或随机写的方式将数据写入 XEOS,避免了传统对象存储仅支持覆盖写所带来的性能瓶颈。这大幅提升了 Alluxio 缓存层的写入效率。

通过 Alluxio 和 XEOS 的深度融合,可以最大限度地减少数据在两者之间的不必要移动。这提供了更高效的数据写入能力,提升了整体的写入性能,大幅降低了 Alluxio 自身的写入开销,优化了系统的资源利用效率。

4.开放数据流动,提高数据流转效率

XEOS 凭借其出色的数据生命周期管理和流动能力,为 Alluxio 提供了强大的支撑。在最新的 6.4 版本中,XEOS 通过开放数据流动 API 进一步增强了这些核心优势:

通过 XEOS 全面的数据流动 API,应用程序可以轻松实现跨云厂商、NAS、蓝光/磁带等不同存储介质的数据流动。Alluxio 只需下发数据流动规则,XEOS 就可以负责执行具体的数据复制、分层、归档等操作。这种深度集成大大减少了 Alluxio 在读取数据后再次写入到统一文件系统(UFS)的开销,降低了整体的数据写入开销。

同时,XEOS 还提供了复制、分层、校验、QoS 等丰富的数据管理功能。通过与 Alluxio 的紧密结合,双方可以根据实际需求,优化数据的存储和访问策略,不仅提升了数据访问性能,也大幅提高了整个数据生命周期的管理效率。

XEOS 6.4 版本在数据流动和生命周期管理方面的创新能力,为 Alluxio 构建高性能、高效、智能的 AI 数据管理平台提供了坚实的基础。

针对 AI 的优势场景:以对象为底座且需要高性能文件访问

Alluxio 和 XEOS 的联合方案,针对尤其是在 AI 场景下,以对象存储作为底座,并且需要高性能文件协议访问的客户具备非常大的价值,包括如下四点:

  • 高性能数据访问:Alluxio 和 XEOS 结合,可以有效综合 XEOS 的高性能对象存储接口能力以及 Alluxio 贴近计算侧的高性能共享缓存层的能力,为计算应用提供高性能数据访问能力。
  • 海量数据存储:XEOS 提供了海量数据存储能力,Alluxio 提供了无状态可扩展的共享缓存能力,都可以随着数据存储以及数据访问规模的增大而扩展,既能支撑海量存储又能提供高性能的大规模数据访问能力。
  • 成本效益:XEOS 作为成熟的对象存储产品,利用一系列技术实现了更加经济的海量数据存储方案,有效降低了企业的海量数据存储成本;Alluxio 则可以通过灵活的部署策略,有效利用企业计算侧的高性能存储空间提供贴近计算侧的共享缓存能力,在不增加额外硬件成本的基础上实现高性能数据访问能力的构建。
  • 架构先进性:XEOS 构建了安全可靠、高性能、低成本的对象存储平台,Alluxio 基于 XEOS 提供了高效数据缓存以及数据访问平台,Alluxio 某种意义上是 XEOS 的扩展客户端,实现 1+1>2 的架构。

√ 可以利用 Alluxio 的统一命名空间实现多个 XEOS 以及 XEOS 和其他文件/对象存储系统的统一访问。

√ 可以利用 Alluxio+XEOS 提供更加高效的 POSIX 和 S3 协议的接口能力。

√ 可以利用 Alluxio+XEOS 提供更完善的安全能力,包括和 Kerberos、Ranger 等集成。

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/22758.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

38. 【Java教程】日期和时间处理

本小节我们将学习 Java 中的日期和时间,日期和时间在我们的实际开发中非常常用,例如用户的注册、数据的增删改、对敏感信息的操作等等都需要记录下日期和时间。通过本小节的学习,你将了解到什么是日期、什么是时间、什么是时区,Ja…

3072. 将元素分配到两个数组中 II

题目 给你一个下标从 1 开始、长度为 n 的整数数组 nums 。 现定义函数 greaterCount ,使得 greaterCount(arr, val) 返回数组 arr 中 严格大于 val 的元素数量。 你需要使用 n 次操作,将 nums 的所有元素分配到两个数组 arr1 和 arr2 中。在第一次操…

WebGL画粗线

目录 前言 基本思路 求左右端点 实现 组织数据 顶点着色器计算端点坐标 效果 前言 WebGL绘制模式有点、线、面三种;通过点的绘制可以实现粒子系统等,通过线可以绘制一些连线关系;面就强大了,通过面,我们可以…

视频监控汇聚平台LntonCVS国标GB28181协议实现语音对讲功能

在当今这个智能技术飞速发展的时代,人工智能已经成为了电子产品领域的一股不可忽视的热门趋势。随着科技的不断进步,越来越多的电子产品开始融入人工智能技术,从而为其开拓了全新的发展路径。在这个大背景下,安防摄像头无插件直播…

基于springboot实现智慧校园之家长子系统项目【项目源码】计算机毕业设计

基于springboot实现智慧校园之家长子系统演示 SpringBoot框架介绍 本课题程序开发使用到的框架技术,英文名称缩写是SpringBoot,在JavaWeb开发中使用的流行框架有SSH、SpringBoot、SpringMVC等,作为一个课题程序采用SSH框架也可以&#xff0c…

【学习】测试用例设计与执行的黄金法则

在软件测试领域,测试用例的设计与执行是确保产品质量的关键环节。一个优秀的测试用例能够揭示软件中的缺陷,而高效的执行则能保障测试覆盖的全面性。如同璀璨的星辰指引航船前行,以下黄金法则将引领测试用例设计与执行的过程,确保…

Go 群发邮件Redis 实现邮件群发

一、安装 go get github.com/go-redis/redis/v8 go get gopkg.in/gomail.v2 二、使用"gopkg.in/gomail.v2"群发 package mainimport (gomail "gopkg.in/gomail.v2" )func main() {// 邮件内容m : gomail.NewMessage()m.SetHeader("From", &qu…

【杂谈】AIGC之Stable Diffusion:AI绘画的魔法

Stable Diffusion:AI绘画的魔法 引言 在AI的世界里,Stable Diffusion就像一位魔法师,它能够将我们脑海中的幻想,用画笔一一描绘出来。今天,就让我们一探这位魔法师的奥秘,看看它是如何从无到有&#xff0…

安装MongoDB单副本说明

参考:https://blog.csdn.net/weixin_43464076/article/details/126509254 https://driverzhang.github.io/post/mongo%E5%BC%80%E5%90%AF%E4%BA%8B%E5%8A%A1%E4%B9%8B%E5%89%AF%E6%9C%AC%E9%9B%86%E9%87%87%E5%9D%91/ https://dev.to/alexalvess/getting-started-wi…

实习面试题(答案自敲)、

1、为什么要重写equals方法,为什么重写了equals方法后,就必须重写hashcode方法,为什么要有hashcode方法,你能介绍一下hashcode方法吗? equals方法默认是比较内存地址;为了实现内容比较,我们需要…

mysql表级锁(表锁/元数据锁/意向锁)

文章目录 表级锁的分类1、表锁(分类)1.表共享读锁(read lock)2.表独占写锁(write lock)3.语法: 2、元数据锁(meta data lock )3、意向锁1.意向共享锁(IS):由语…

【wiki知识库】05.分类管理实现--前端Vue模块

📝个人主页:哈__ 期待您的关注 目录 一、🔥今日目标 二、🌏前端部分的改造 2.1 新增一个tool.ts 2.2 新增admin-categoty.vue 2.3 添加新的路由规则 2.4 添加the-welcome.vue 2.5 修改HomeView.vue 三、❗注意 一、&…

车来了冲刺上市:业绩波动明显,依赖广告业务,滴滴、阿里入股

近日,MetaLight Inc.(下称“元光科技”或“车来了”)向港交所递交招股说明书,中金公司为其独家保荐人。 据招股书介绍,元光科技专注于利用时序数据(按时间顺序排列的数据点)来发现及预测分析对…

docker 存储 网络 命令

文章目录 1 docker存储1.1 目录挂载2.1卷映射2.1.1卷映射和目录挂载的区别2.1.2卷映射的使用 2 docker网络2.1查看docker的默认网络2.2查看容器的IP2.3容器互通2.4自定义网络2.4.1 创建自定义网络2.4.2创建容器的时候加入到自定义的网络2.4.3使用域名进行容器之间的访问2.4.4re…

盛凌电子IPO终止:实控人蒋志坚曾和前妻黄新打官司,儿子已离职

保荐人撤销,致使公司IPO终止。 近日,深圳证券交易所披露的信息显示,深圳盛凌电子股份有限公司(下称“盛凌电子”)的保荐人申万宏源证券撤回上市申请文件。因此,深圳证券交易所决定终止对该公司首次公开发行…

Qt报错:libvlc开发的程序,出现Direct3D output全屏窗口

问题描述: 在qt中开发重播模块时,第一次在窗口正常播放,点击重播按钮后会弹出新的Direct3D output窗口播放视频 分析: 因为libvlc_media_player_set_hwnd 这个函数 设置了不存在的窗口句柄,导致vlc视频播放窗口没有嵌…

kubesz(一键安装k8s)

引言 Kubernetes(K8s)是一个开源的容器编排系统,用于自动化部署、扩展和管理容器化应用程序。kubeasz 是一个用于快速搭建 Kubernetes 高可用集群的项目,它基于 Ansible,通过提供一套简单、易用的配置,使得…

用易查分制作活动抽奖系统,支持随机分配中奖结果!

学校或企业在开展抽奖活动时,如何确保公平公正,随机挑选中奖人员呢? 易查分的预置数据分配功能就可以实现,并且支持提交信息后随机分配中奖结果,不受任何人为因素的影响。下面就来教大家如何制作吧。 📌使用…

ArcGIS for Vue3

二维&#xff1a; 1、创建vue项目 npm create vitelatest 2、安装ArcGIS JS API依赖包 npm install arcgis/core 3、引入ArcGIS API for JavaScript模块 <script setup> import "arcgis/core/assets/esri/themes/light/main.css"; import Map from arcgis…

HTML5+CSS3+JS小实例:网格图库

实例:网格图库 技术栈:HTML+CSS+JS 效果: 源码: 【HTML】 <!DOCTYPE html> <html lang="zh-CN"><head><meta charset="UTF-8"><meta name="viewport" content="width=device-width, initial-scale=1.0&…