Amazon SageMaker: 拓展机器学习边界,塑造未来创新趋势

授权说明:本篇文章授权活动官方亚马逊云科技文章转发、改写权,包括不限于在 亚马逊云科技开发者社区, 知乎,自媒体平台,第三方开发者媒体等亚马逊云科技官方渠道。

近期在 re:Invent 2023 大会上,亚马逊云科技发布了一组引人注目的新功能,重点强调了生成式人工智能在塑造人工智能未来方向上的引领地位。其中,Amazon SageMaker作为一款全面托管的机器学习服务,在其新功能的引领下,能够为用户提供更高效、更强大的机器学习工具。我将在后文对Amazon SageMaker的产品进行使用体验,以及对其进行全面的总结。

目录

一、 Amazon SageMaker: 高效、便捷的机器学习全方位解决方案

二、SageMaker新功能:突破创新之路

1. SageMaker HyperPod和Inference:强大的训练与部署基础设施

2. SageMaker Clarify和Canvas:负责任AI的评估与直观工作流

三、功能测评体验

四、体验感悟和总结


一、 Amazon SageMaker: 高效、便捷的机器学习全方位解决方案

Amazon SageMaker以其全面而先进的功能和解决方案,为用户提供了更多可能性,使机器学习的构建、训练和部署过程更加便捷高效。SageMaker持续推动着机器学习技术的进步,也为用户提供了更为出色的工具和平台。这一系列优势共同构成了SageMaker在机器学习领域的引领地位。

通过专注于创新,提供面向数据科学家的IDE和无代码界面,Amazon SageMaker能够让开发者轻松利用机器学习处理结构化和非结构化数据。其优化基础设施将培训时间从几小时缩短到几分钟,专用工具提高团队生产力多达10倍。此外,自动执行和标准化MLOps实践和治理,支持组织中的透明度和可审核性。

、SageMaker新功能:突破创新之路

Amazon SageMaker作为全面托管的机器学习服务,为我们提供了无需关注底层复杂性的机会,将重心集中在模型的构建和优化上。通过SageMaker,我们可以轻松构建和训练机器学习模型,并将其直接部署到生产就绪的托管环境中。这一服务不仅提供了集成的Jupyter编写Notebook实例,方便访问数据源进行探索和分析,还支持常见机器学习算法,为分布式环境中的高效数据处理提供了优化的解决方案。

1. SageMaker HyperPod和Inference:强大的训练与部署基础设施

亚马逊云科技最新发布的SageMaker HyperPod和Inference功能展现了其对机器学习领域的持续创新。SageMaker HyperPod是为大规模分布式训练而设计的创新基础设施,旨在解决训练模型所面临的复杂性和高成本挑战。SageMaker HyperPod通过预配置SageMaker的分布式训练库,自动将训练工作负载分发到数千个加速器中,实现并行处理以提高模型性能。

SageMaker Inference则致力于降低模型部署的成本和延迟,满足组织对性能优化的需求。用户可以单独控制每个模型的扩展策略,以适应不同的模型使用模式,同时优化基础架构成本。通过智能路由推理请求,SageMaker主动监控处理请求的实例,并将请求平均路由到可用的实例。

2. SageMaker Clarify和Canvas:负责任AI的评估与直观工作流

SageMaker Clarify和Canvas功能的引入进一步推动了机器学习应用的发展。SageMaker Clarify为用户提供了一种负责任使用AI的便捷方式,快速评估和选择基础模型。通过支持用户有效评估模型,确保其符合负责任的AI标准。用户可以轻松提交模型进行评估,也可以通过SageMaker JumpStart选择适用于其用例的模型,同时获取详细的报告,为用户提供基于性能标准的快速比较、评估和选择最佳模型的便利。

新的Amazon SageMaker Canvas增强功能使用户更轻松、更快速地将生成式AI集成到其工作流程中。Canvas支持用户在无代码环境中构建ML模型并生成预测,无需编写任何代码。此次更新扩展了Canvas的即用型功能,使用户能够更直观地准备数据,通过自然语言指令解决常见的数据问题。

功能测评体验

首先用户在亚马逊云科技官网完成账号登录,没有账号的需要先进行注册,登录之后来到个人控制台,在搜索栏搜索Amazon SageMaker服务:

进入到Amazon SageMaker服务界面之后,在左侧导航栏找到笔记本模块,点击笔记本实例,并进行创建:

。进入创建界面后,可以根据开发需要进行配置信息选择,同时也可以新的IAM角色,也可以使用已经存在的角色。

稍等片刻,等待笔记本实例状态变为InService,即表示实例可用。

为了测试使用,我们在顶部搜索栏搜素S3存储桶服务,然后创建通用存储桶,配置完信息之后,等待存储桶的创建完毕,之后我们可以进入桶内部进行相关操作。

进入存储桶中之后,我们可以通过上传功能将本地的资源进行上传到S3存储桶中,如图,我将本地的一些图片资源传输到我创建的存储桶中。

回到Amazon SageMaker界面,进入Jupyter界面:

进入界面之后,选择图中所示功能进行相关操作:

然后输入如下python代码:注意,需要将其中的S3存储桶对应的信息切换为刚才咱们创建的S3通用存储桶信息才可以生效,在这一块,我贴出代码:

import sagemakersess = sagemaker.Session()
bucket = sess.default_bucket()!xxx s3 sync s3://sagemaker-sample-files/datasets/image/caltech-101/inference/ s3://{bucket}/ground-truth-demo/images/print('Copy and paste the below link into a web browser to confirm the ten images were successfully uploaded to your bucket:')
print(f'https://s3.console.xxx.amazon.com/s3/buckets/{bucket}/ground-truth-demo/images/')print('\nWhen prompted by Sagemaker to enter the S3 location for input datasets, you can paste in the below S3 URL')print(f's3://{bucket}/ground-truth-demo/images/')print('\nWhen prompted by Sagemaker to Specify a new location, you can paste in the below S3 URL')print(f's3://{bucket}/ground-truth-demo/labeled-data/')

标红的一处需要将对应信息切换成我们刚才创建的S3存储桶对应信息。

回到Amazon SageMaker界面,我们选择Ground Truth模块中的贴标作业,然后创建标准作业。

在创建的时候,选择我们刚才创建的S3存储桶,然后根据开发需求进行相关信息配置,配置完毕之后,开始创建。

在数据设置中,将S3存储桶可以设置成我们刚才创建好的,同时数据类型选择图像,IAM角色选择创建新角色或使用早前Jupyter笔记本的对应数值:

在任务设置中,选择图像作为任务类型,选择图像分类(单个标签)作为任务类别,然后点击下一步。

标注作业创建完毕之后,可以查看相关的信息。

核查标注作业结果也至关重要,可评估标记质量和确定是否需要优化说明和数据。回到我们的SageMaker控制台,选择Labeling jobs标注作业,然后选择我们刚才创建好的作业,然后就可以进行对所选作业结果进行评估。

标注作业创建成功之后,我们选择左侧功能栏中的训练模块,开始根据需求进行作业训练,以便达到想要的结果。

然后训练作业,点击创建训练作业并且去配置相关训练参数,这一块信息配置可以根据开发需要进行相关设置。

完成训练作业,当我们看到作业状态变更为success,即表示作业训练完成。

、体验感悟和总结

作为一个机器学习爱好者,我对SageMaker HyperPod和Inference功能的引入感到非常激动。HyperPod作为一项创新性基础设施,解决了我在大规模分布式训练中所面临的挑战。以前,使用GPU和Trainium计算实例进行训练时,我常常碰到数据量增加、模型大小膨胀以及训练时间延长的问题。

HyperPod的出现改变了这一切,通过自动分发训练工作负载到数千个加速器中,显著提高了我的模型性能。同时,它的定期保存检查点功能确保了在硬件故障发生时的平稳继续训练,省去了我繁琐的手动管理过程。现在,我能够更加高效地进行数周甚至数月的训练,为我的模型构建和优化提供了更多的便利。

而SageMaker Inference则是解决模型部署过程中成本和延迟问题的救星。通过支持将多个模型部署到同一实例,Inference平均降低了部署成本约50%。这让我可以更灵活地控制每个模型的扩展策略,更好地适应不同的模型使用模式,同时有效地优化基础架构成本。通过智能路由推理请求,SageMaker还能够主动监控实例处理请求的情况,将请求平均路由到可用的实例,降低了推理延迟约20%。

这一系列创新性功能的整合不仅在硬件基础设施的优化上取得了显著进展,同时也为我提供了更加便捷、高效的机器学习工作流。整体来说,Amazon SageMaker新推出的功能为用户在AI领域的探索之路提供了更为强大的支持,让用户更加期待未来在机器学习领域的深入应用。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/221770.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Stable Diffusion 源码解析(1)

参考1:https://blog.csdn.net/Eric_1993/article/details/129393890 参考2:https://zhuanlan.zhihu.com/p/613337342 1.StableDiffusion基本原理1.1 UNetModel、FrozenCLIP 模型1.2 DDPM、DDIM、PLMS算法 2. Runwayml SD 源码2.1 Img2Img Pipeline2.2 DD…

蚁群优化算法ACO

蚁群优化算法模拟了自然界中蚂蚁的觅食行为,信息素浓度的大小表征路径的远近,信息素浓度越高,表示对应的路径距离越短。同时,路径上的信息素浓度会随着时间的推进而逐渐衰减。 1.过程 (1)初始化参数 蚁群…

Nginx+Tomcat实现负载均衡和动静分离

目录 前瞻 动静分离和负载均衡原理 实现方法 实验(七层代理) 部署Nginx负载均衡服务器(192.168.75.50:80) 部署第一台Tomcat应用服务器(192.168.75.60:8080) 多实例部署第二台Tomcat应用服务器(192.168.75.70:80…

8080端口被占用怎么解决,并结束释放8080端口

8080端口是被用于WWW代理服务的,可以实现网页浏览,经常在访问某个网站或使用代理服务器的时候,Win10 8080端口被占用解决方法吧。 1、按【 Win r】 2、运行窗口,输入【cmd】命令,按【确定或回车】,打开命…

基于SpringBoot 校园招聘系统设计与实现(源码+文档+可视化HTML+数据库)

摘 要 基于SpringBoot 校园招聘系统是一种基于Java技术的校园招聘和可视化展示的系统。该系统通过采集和整合各类招聘网站、社交媒体等渠道的数据,对招聘岗位进行深入分析,并将分析结果以直观、易懂的可视化形式呈现。系统能够自动从多个数据源获取招聘…

电子学会C/C++编程等级考试2023年03月(五级)真题解析

C/C++等级考试(1~8级)全部真题・点这里 第1题:拼点游戏 C和S两位同学一起玩拼点游戏。有一堆白色卡牌和一堆蓝色卡牌,每张卡牌上写了一个整数点数。C随机抽取n张白色卡牌,S随机抽取n张蓝色卡牌,他们进行n回合拼点,每次两人各出一张卡牌,点数大者获得三颗巧克力,小者获…

Flutter:web项目跨域问题解决

前后端解决系列 文章目录 一、Flutter web客户端解决本地环境调试跨域问题二、Flutter web客户端解决线上环境跨域问题 一、Flutter web客户端解决本地环境调试跨域问题 就一句命令【--web-browser-flag "--disable-web-security"】,用来屏蔽浏览器域名请…

大模型时代-让AI自己开发自己

一、前言 AI能自己开发自己或者开发和一个很像自己的东西吗?显然是可以的!因为AI模型的算法,基本就是学习和递归 二、大模型的算法实现例子 本例子就是通过AI模型来写 大模型的实现通常涉及到深度学习框架和大量的计算资源。具体的算法代…

Java入门学习笔记二

一、抽象类 当编写一个类时,我们往往会为该类定义一些方法,这些方法是用来描述该类的行为方式,那么这些方法都有具体的方法体。 分析事物时,发现了共性内容,就出现向上抽取。会有这样一种特殊情况,就是功…

Python实现高效摸鱼,批量识别银行卡号并自动写入Excel表格

前言 每当有新员工入职,人事小姐姐都要收集大量的工资卡信息,并且生成Excel文档,看到小姐姐这么辛苦,我就忍不住要去帮她了… 于是我用1行代码就实现了自动识别银行卡信息并且自动生成Excel文件,小姐姐当场就亮眼汪汪…

智能冶钢厂环境监控与设备控制系统(边缘物联网网关)

目录 1、项目背景 2、项目功能介绍 3、模块框架 3.1 架构框图 3.2 架构介绍 4、系统组成与工作原理 4.1 数据采集 4.2 指令控制 4.3 其他模块 4.3.1 网页、qt视频流 4.3.2 qt搜索进程 5、成果呈现 6、问题解决 7、项目总结 1、项目背景 这个项目的背景是钢铁行业的…

tesseract-ocr安装使用

描述: 在centos上安装 tesseract 并在springboot项目中使用 步骤一:安装 确认使用的版本tesseract和test4j版本需要匹配,这里选择最新版 tesseract5.3.3 ,test4j 5.9.0 版本匹配可查看 Releases nguyenq/tess4j GitHub 或…

使用 iperf 和 iftop 测试网络带宽

博主历时三年精心创作的《大数据平台架构与原型实现:数据中台建设实战》一书现已由知名IT图书品牌电子工业出版社博文视点出版发行,点击《重磅推荐:建大数据平台太难了!给我发个工程原型吧!》了解图书详情,…

CSS中神奇的filter属性

CSS是Web开发中不可或缺的一部分,它可以帮助开发者在页面上添加各种各样的样式和效果。其中一个比较神奇的CSS属性就是filter,它可以让我们实现各种有趣的图形处理效果。 一、filter属性的基础 filter属性是CSS中用于对元素进行图形效果处理的属性之一…

C语言—每日选择题—Day47

第一题 1. 以下逗号表达式的值为() (x 4 * 5, x * 5), x 25 A:25 B:20 C:100 D:45 答案及解析 D 本题考查的就是逗号表达式,逗号表达式是依次计算每个表达式,但是只输出最后一个表…

【算法题】开源项目热度榜单(js)

解法 const lines ["4","8 6 2 8 6","camila 66 70 46 158 80","victoria 94 76 86 189 211","athony 29 17 83 21 48","emily 53 97 1 19 218", ]; const lines2 ["5","5 6 6 1 2","…

ArkTS入门

代码结构分析 struct Index{ } 「自定义组件:可复用的UI单元」 xxx 「装饰器:用来装饰类结构、方法、变量」 Entry 标记当前组件是入口组件(该组件可被独立访问,通俗来讲:它自己就是一个页面)Component 用…

tuxera2023破解版免费下载 NTFS for Mac读写工具(附序列号)

Tuxera ntfs 2023 破解安装包是一个mac读写ntfs磁盘工具允许您访问,它允许您访问NFTS 驱动器上的文件。 该应用程序提供访问访问Mac 设备中NFTS 格式文件的驱动力,因此您有权基于格式文件进行无困难的访问Windows 数据。 在发生电力灾难或断电时使用防损…

Signal EM的流程与分析

RedhawkTM 提供了一种在设计中分析Power EM和SignalEM的单一平台方法。Power EM通常作为Static IR和Dynamic IR分析的组成部分进行。Signal EM分析是单独进行分析的,检查设计中所有信号线和过孔的平均(单向或双向)、RMS和峰值电流密度【1】。 1 SignalEM 流程介绍 如图7…

ArrayList集合的两个实例应用,有趣的洗牌算法与杨辉三角

本节课的内容,就让我们来学习一下ArrayList集合的应用,ArrayList的本质就是一个顺序表,那下面一起来学习吧 目录 一、杨辉三角 1.题目详情及链接 2.剖析题目 3.思路及代码 二、洗牌算法 1.创造牌对象 2.创造一副牌 3.洗牌操作 4.发…