WARP 加速您的 AI 数据存储基础设施

你知道一些最好的人工智能模型的秘诀吗?这是他们可以访问的数据量,他们可以接受培训。对于 AI/ML 模型:快速访问数据为王。让我强调一下,这不仅仅是数据,而是快速访问的数据。如果有人可以构建更快、更强大的模型,那么你已经输掉了人工智能竞赛。

在设计 AI 基础设施组件(尤其是数据存储组件)时,当 ML 工程师和数据科学家需要存储机器学习算法并有效管理 MinIO 集群中的可用资源时,确保他们的整体体验至关重要。这确保了快速有效地构建可靠的模型,而不会成为存储基础设施的瓶颈。

AI 基础设施层中需要多个组件,这些组件不仅需要构建 AI 模型,还需要将生成的模型训练并存储在可快速访问的数据存储(如 MinIO)中。ML Ops 的世界正处于 DevOps 的交汇点,并集成了正在以极快速度生成的 ML 模型。在这篇文章中,我们将向您展示如何使用 WARP 衡量 MinIO AI 数据存储基础设施的性能。

WARP 是一款开源全功能 S3 性能评估软件,用于在 WARP 客户端和对象存储主机之间进行测试。WARP 针对 MinIO 集群测量多个客户端的 GET 和 PUT 性能。WARP 具有许多选项,可通过命令行或环境变量进行配置,允许您创建与工作负载一致的测试。我们将快速向您展示如何运行它,以便您可以开始分析您的 AI 数据存储基础设施。

运行和分析 WARP

创建 warp 客户端侦听器以运行分布式 warp 基准测试,在这里我们将它们作为跨客户端节点的有状态集运行。

kubectl apply -f https://raw.githubusercontent.com/minio/warp/master/k8s/warp.yaml

在 warp-job.yaml 中,更新 --warp-clients and --host 标志,以匹配您的集群细节。设置后,按如下方式部署


kubectl apply -f https://raw.githubusercontent.com/minio/warp/master/k8s/warp-job.yaml

WARP 作业完成后,可以在日志中找到状态

kubectl get pods -l job-name=warp-jobNAME             READY   STATUS      RESTARTS   AGEwarp-job-6xt5k   0/1     Completed   0          8m53s~ kubectl logs warp-job-6xt5k...-------------------Operation: PUT. Concurrency: 256. Hosts: 4.* Average: 412.73 MiB/s, 12.90 obj/s (1m48.853s, starting 19:14:51 UTC)Throughput by host:* http://minio-0.minio.default.svc.cluster.local:9000: Avg: 101.52 MiB/s, 3.17 obj/s (2m32.632s, starting 19:14:30 UTC)...Aggregated Throughput, split into 108 x 1s time segments:* Fastest: 677.1MiB/s, 21.16 obj/s (1s, starting 19:15:54 UTC)* 50% Median: 406.4MiB/s, 12.70 obj/s (1s, starting 19:14:51 UTC)* Slowest: 371.5MiB/s, 11.61 obj/s (1s, starting 19:15:42 UTC)

您还可以将 WARP 设置为执行分布式基准测试。这使您可以使用多个 WARP 客户端以更逼真的方式执行测试,就像现实世界中通常的情况一样。

运行 WARP 时,请确保安装客户端的节点位于专用服务器上,因为如果客户端暴露,则可能会受到 DDoS。此外,避免在生产高峰期运行 WARP,否则最终可能会陷入资源争夺的境地。

可以随机化对象大小,文件将具有“随机”大小,直至精细的对象大小。

对象示例(水平)及其大小,最大 100MB:

当结果被认为是稳定的时,也可以自动终止 WARP。为了检测稳定的设置,Warp 连续将当前数据下采样到当前时间范围内延伸的 25 个数据点。要使基准测试被视为“稳定”,25 个数据点中的最后 7 个必须在指定的百分比内。

从一段时间内的吞吐量来看,它可能看起来像这样

红框显示用于评估稳定性的窗口。盒子的高度由当前速度的阈值百分比决定。

超速前进!

我们鼓励您参阅文档,了解如何执行更多测试方案。例如,您可以启用 TLS 和服务器端加密来衡量它们在环境中的影响。可以通过增加并发测试的数量来增加基础结构的压力。您可以使用对象大小的随机组合,也可以指定与当前环境和工作负载相匹配的对象大小。您可以将测试配置为在定义的时间段内运行或自动终止,就像我们上面所做的那样。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/859826.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

骚操作:如何让一个网页一直处于空白情况?

🧑‍💻 写在开头 点赞 收藏 学会🤣🤣🤣 如题,惯性思路很简单,就是直接撸上一个空内容的html。 注:以下都是在现代浏览器中执行,主要为**Chrome 版本 120.0.6099.217&…

在 The Sandbox 体验韩剧《碰撞搜查线》的刺激!

风靡全球的韩国电视剧《碰撞搜查线》现已登陆 The Sandbox 元宇宙! ASTORY 的电视剧《碰撞搜查线》以充满动作喜剧色彩的方式,讲述了一个交通犯罪调查小组打击公路上的恶棍的故事。该剧迅速成为 Disney 最受欢迎的节目之一! 在 The Sandbox体…

「动态规划」如何求最长递增子序列的长度?

300. 最长递增子序列https://leetcode.cn/problems/longest-increasing-subsequence/description/ 给你一个整数数组nums,找到其中最长严格递增子序列的长度。子序列是由数组派生而来的序列,删除(或不删除)数组中的元素而不改变其…

CAN通讯相关知识拆解报文格式过滤器数据交互

在嵌入式系统中使用CAN(Controller Area Network)通讯,需要掌握以下内容: CAN协议:了解CAN总线通讯的基本原理,包括帧格式、报文结构、消息ID等内容。CAN控制器:理解CAN控制器的工作原理以及如…

java连接mysql报错

1.背景,直接升级操作系统从centos-》国产化操作系统,mysql也升级到5.7.44 2,报错 Caused by: com.mysql.jdbc.exceptions.jdbc4.MySQLNonTransientConnectionException: Could not create connection to database server. Attempted reconn…

品牌策划背后的秘密:我为何对此工作情有独钟?

你是否曾有过一个梦想,一份热爱,让你毫不犹豫地投身于一个行业? 我就是这样一个对品牌策划充满热情的人。 从选择职业到现在,我一直在广告行业里“混迹”,一路走来,也见证了许多对品牌策划一知半解的求职…

适用于Mac的免费外置硬盘数据恢复软件

“我有一个 1 TB 的外置硬盘,它被意外格式化了。我尝试从中恢复丢失的数据。我把它连接到我的Mac,但里面什么也没找到。我正在寻找适用于Mac的免费外置硬盘数据恢复软件,例如奇客数据恢复Mac版或其他Mac数据恢复免费软件来扫描它并恢复数据。…

人工ai智能写作,分享推荐三款好用软件!

在数字化时代,人工智能(AI)已经渗透到我们生活的方方面面,而在内容创作领域,AI智能写作软件更是如雨后春笋般涌现。今天,就为大家分享三款备受好评的AI智能写作软件,让你轻松掌握高效写作的秘密…

win10系统管理员账号怎么切换

1、按住“windowsx”,选择“计算机管理” 2、在页面左侧,找到“计算机管理(本地)”,展开“系统工具”,点击“本地用户和组”下面的“用户”,在右侧找到“Administrator”,双击打开。 3、在打开页面选择常规…

Docker(六)-本地镜像发布到私有库

1.下载镜像Docker Registry 用于搭建私人版本Docker Hub docker pull registry2.运行私有库Registry 运行私有库Registry,相当于本地有个私有Docker hubdocker run -d -p hostPort:containerPort -v 【宿主机目录】:【容器目录】 --privilegedtrue 【私有库镜像】…

泛微E9开发 根据判断条件,控制字段的编辑/必填属性

根据判断条件,控制字段的编辑/必填属性 1、需求说明2、实现方法3、扩展知识点1. 注册钩子事件,指定动作完成后触发1.1 接口名称及参数说明1.2 案例 2. 改变单个字段显示属性(只读/必填等)2.1 参数说明2.2 案例 1、需求说明 当字段“填报人”和字段“姓名…

android-aidl4

转:Android Aidl的使用_android aidl使用-CSDN博客 一.准备 Parcelable,可以理解成只是把car整个对象在aidl中进行传递,就理解成一个car的一个类吧,和其他类使用一样就行了,回调:把接口作为参数放在函数参…

Spring Boot集成Redisson

文章目录 Spring Boot集成Redisson1. Redisson概述2. Redission作用3. 集成Redission前提:步骤 1: 添加依赖步骤 2: 配置Redisson 4. 结论 Spring Boot集成Redisson 1. Redisson概述 Redisson是一个在Redis基础上实现的Java驻内存数据网格(In-Memory D…

从广州到上海|荣载光的智慧 与SSHT共同探索智能照明更多想象空间

随着生活水平的提高,大众对高品质生活的追求脚步逐步加快,人们对智能照明的需求日益多样化,不再仅仅满足于传统的照明功能,而是转向智能照明系统,提出更高的需求。 展望未来,中国智能照明市场预计将迎来全…

文旅景区科技馆增加5D影院项目VR游乐场

王屋山风景名胜区增加20座5D影院设备,5D影院不像普通电影院,5D影院座椅可以根据影片播放内容,进行实时摆动和各种特效,闪电,振臀振臂,泡泡等个种特效。影片内容可以进行定制,根据景区文化风光&a…

AI交互及爬虫【数据分析】

各位大佬好 ,这里是阿川的博客,祝您变得更强 个人主页:在线OJ的阿川 大佬的支持和鼓励,将是我成长路上最大的动力 阿川水平有限,如有错误,欢迎大佬指正 Python 初阶 Python–语言基础与由来介绍 Python–…

k8s学习--chart包开发(创建chart包)

文章目录 chart包应用环境一、安装helm客户端工具二、chart包目录结构三、创建不可配置的chart1.创建目录和chart.yaml2.创建deployment.yaml3.创建service.yaml4.使用chart安装应用5.查看和验证 四、创建可配置的Chart1.官方的预定义变量2.新增values.yaml文件3.配置deploy引用…

网络安全协议

1. 概述 1.1 网络安全需求 五种需求: 机密性:防止数据未授权公开,让消息对无关听众保密 完整性:防止数据被篡改 可控性:限制对网络资源(硬件和软件)和数据(存储和通信&#xff0…

计算机网络 交换机的安全配置

一、理论知识 1.交换机端口安全功能介绍 交换机端口安全功能是针对交换机端口进行安全属性的配置,以控制用户的安全接入。主要包括以下两种配置项: ①限制交换机端口的最大连接数:控制交换机端口连接的主机数量;防止用户进行恶…

kafka基础概念

目录 1、kafka简介 2、kafka使用场景 3、kafka基础概念 3.1、消息 3.1.1、消息构成详解 3.1.2、消息存储设计 3.2、topic 3.3、partition 3.4、offset 3.5、replication 3.5.1、replication简介 3.5.2、副本角色 3.5.3、副本类型 3.5.3.1、副本类型简介 3.5.3.2、…