大语言模型（LLMs）在 Amazon SageMaker 上的动手实践（一）

大语言模型（LLMs）在 Amazon SageMaker 上的动手实践（一）

news/2025/4/29 9:39:16/文章来源:https://blog.csdn.net/zixunkandian/article/details/134673596

本期文章，我们将通过三个动手实验从浅到深地解读和演示大语言模型（LLMs），如何结合 Amazon SageMaker 的模型部署、模型编译优化、模型分布式训练等。

实验一：使用 Amazon SageMaker 构建基于开源 GPT-J 模型的对话机器人应用

开发者可以使用 Amazon SageMaker 构建一个交互式的人机对话应用 DEMO，尝试基于开源 GPT-J 模型的 Text Generation 技术。Amazon SageMaker 是亚马逊云科技公有云中的一项托管服务。作为一个云机器学习平台，可以让开发者在云中创建、训练和部署 ML 模型以此来对大语言模型有更深刻的认知。

这一动手实验仅仅使用 20 行左右的代码，即可将开源的 GPT-J 模型部署到 Amazon SageMaker 的终端节点（Endpoint），实现基于大语言模型的简单交互式人机对话。完成该实验的代码编写和模型部署预计需要 20 分钟。

什么是 GPT-J:

GPT-J 是一种生成式预训练（GPT）大语言模型，就其架构而言，它可与 GPT-3 等流行的私有大语言模型相媲美。它由大约 60 亿个参数和 28 个层组成，包括一个前馈模块和一个自注意力模块。为 GPT-J 提供推理所需的内存要低得多——在 FP16 中，模型权重占用不到 13 GB，这意味着可以在单个 16GB GPU 上轻松进行推理。

1. 创建 SageMaker Notebook 实例

在亚马逊云科技控制台（console.aws.amazon.com）上，输入 “Amazon SageMaker” 并点击进入，然后在左侧导航菜单中找到 “Notebook instances”，点击右上角的 “Create notebook instance” 开始创建。如下图所示：

在创建 Notebook instances 的过程中，需要指定在 Amazon SageMaker 中运行代码的角色（role）。由于需要访问 Amazon S3 等资源（存放模型训练需要的数据、模型构件等），因此必须设置合适的角色（role）使其具有访问相关 Amazon S3 的权限。如下图所示：

提交后等待几分钟，可以看到状态变成 “InService”，即表示该实例已经成功创建。如下图所示：

如果之前已经创建过（并且没有 delete），可以直接点击 ”Start” 重新启动实例。如下图所示：

当状态从 “Pending” 变成 “InService”，即表示该实例已经成功启动。如下图所示：

2. 进入 Open Jupyter/JupyterLab 环境

如下图，点击 Open Jupyter 或者 Open JupyterLab 环境。我个人更喜欢 Open JupyterLab，因此本文中会主要以 Open JupyterLab 来做讲解和演示：

点击 “Terminal”，以打开一个终端：

在打开的终端中输入以下命令：

$ pwd

$ cd SageMaker

$ git clone https://github.com/hanyun2019/aigc.git

输出如下：

这时你会看到左侧菜单栏增加了 “aigc” 目录：

该目录下的文件如下图所示：

双击 “deploy-gptj.ipynb” 打开这个文件，即可开始逐步完成实验一：

3. 使用 Amazon SageMaker 构建基于开源 GPT-J 模型的对话机器人应用

以下逐行解释实验一的主要代码。

首先，需要安装 SageMaker 的相关 SDK：

!pip install -U sagemaker

然后 import 实验需要的 HuggingFace API 和 SageMaker 的 API 包：

from sagemaker.huggingface import HuggingFaceModel

import sagemaker

定义创建终端节点的 IAM 角色权限：

# IAM role with permissions to create endpoint

role = sagemaker.get_execution_role()

定义 GPT-J 模型构件所在的 S3 桶：

# public S3 URI to gpt-j artifact

model_uri="s3://huggingface-sagemaker-models/transformers/4.12.3/pytorch/1.9.1/gpt-j/model.tar.gz"

调用 HuggingFace API 来创建模型相关参数，包括：模型构件文件名、transformers 的版本号、PyTorch 的版本号、Python 的版本号、角色名等：

# create Hugging Face Model Class

huggingface_model = HuggingFaceModel(

model_data=model_uri,

transformers_version='4.12.3',

pytorch_version='1.9.1',

py_version='py38',

role=role,

)

以上设置完毕后，即可部署模型到 Amazon SageMaker 的终端节点了。可以在这里设置一些终端节点的参数，比如节点实例数量、节点类型等：

# deploy model to SageMaker Inference

predictor = huggingface_model.deploy(

initial_instance_count=1, # number of instances

instance_type='ml.g4dn.xlarge' #'ml.p3.2xlarge' # ec2 instance type

)

运行以上 “huggingface_model.deploy” 代码后，会在 Amazon SageMaker 控制台的 “EndPoints” 看到有实例正在创建（Creating）中，如下图所示：

当看到实例创建完成（InService），即可开始进行推理，即开始和聊天机器人对话了！

如下图所示，我们询问的是中国香港地区的最高建筑、最贵物业等信息。你可以自己定义问题，从中获得和大模型（GPT-J）聊天机器人对话的乐趣！

特别提醒：完成该实验后，记得删除终端节点，以避免不必要的终端节点收费。如下图所示：

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/news/188654.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

C语言错误处理之 “strerror和perror函数以及断言处理方式”

C语言错误处理之 “strerror和perror函数以及断言处理方式”

目录前言 perror函数 strerror函数断言处理方式前言在错误处理一中，我们解释了C语言三种处理方式中的错误号处理方式，这一篇我们在基于上一篇的基础上加入了strerror函数与perror函数，以及断言处理方式的内容...... perror函数包…

阅读更多...

VSCode下载安装教程+安装插件

VSCode下载安装教程+安装插件

一、vscode下载安装 1.打开官网：https://code.visualstudio.com/Download 2.选择跟你电脑相对应的版本下载，我是win10，所以选择如下： 3.下载到你想要保存的目录下 4.下载完成后打开目录，双击安装包 5. 同意&#xff…

阅读更多...

使用YOLOv8训练自己的数据集

使用YOLOv8训练自己的数据集

🍨 本文为🔗365天深度学习训练营中的学习记录博客🍖 原作者：K同学啊 | 接辅导、项目定制拉取项目 git clone https://github.com/ultralytics/ultralytics安装依赖 cd ultralytics pip install -r requirement.txt pip instal…

阅读更多...

【android开发-10】android中四种布局详细介绍

【android开发-10】android中四种布局详细介绍

在Android开发中，常见的四种布局分别是：线性布局（LinearLayout）、相对布局（RelativeLayout）、帧布局（FrameLayout）和绝对布局（AbsoluteLayout）。注意&#…

阅读更多...

Springboot_Tomcat数据库连接池配置

Springboot_Tomcat数据库连接池配置

Springboot_Tomcat数据库连接池配置一、环境二、连接池使用的配置类三、Tomcat JDBC 连接池属性及默认值四、ymal配置tomcat数据库连接池示例五、验证配置的参数是否生效六、返回的验证结果总结一、环境 jdk 1.8springboot 1.56 二、连接池使用的配置类包名：…

阅读更多...

代码随想录算法训练营第五十一天 | 309.最佳买卖股票时机含冷冻期，714.买卖股票的最佳时机含手续费，股票总结

代码随想录算法训练营第五十一天 | 309.最佳买卖股票时机含冷冻期，714.买卖股票的最佳时机含手续费，股票总结

目录 309.最佳买卖股票时机含冷冻期 714.买卖股票的最佳时机含手续费股票问题总结 309.最佳买卖股票时机含冷冻期题目链接：309. 买卖股票的最佳时机含冷冻期分为四种状态： 0. 持有股票 1. 不持有股票——卖出状态 2. 不持有股票——今天卖出 3. 今天为…

阅读更多...

第16届中国R会议暨2023X-AGI大会开幕，和鲸科技分享ModelOps在数据科学平台中的实践与应用

第16届中国R会议暨2023X-AGI大会开幕，和鲸科技分享ModelOps在数据科学平台中的实践与应用

11月25日，第 16 届中国 R 会议暨 2023 X-AGI 大会在在中国人民大学逸夫会堂拉开帷幕，本次会议由中国人民大学统计学院、中国人民大学应用统计科学研究中心、统计之都、原灵科技和中国商业统计学会人工智能分会（筹）主办&#xff0c…

阅读更多...

React项目使用NProgress作为加载进度条

React项目使用NProgress作为加载进度条

React项目使用NProgress作为加载进度条 0、效果1、react安装依赖2、使用3.进度条颜色设置文档参考：https://zhuanlan.zhihu.com/p/616245086?utm_id0 0、效果如下，可全局在页面顶部有一条进度条 1、react安装依赖 yarn add nprogress通过以上安装…

阅读更多...

pytest自动化框架之allure测试报告的用例描述设置

pytest自动化框架之allure测试报告的用例描述设置

allure测试报告的用例描述相关方法；如下图 allure标记用例级别severity 在做自动化测试的过程中，测试用例越来越多的时候，如果执行一轮测试发现了几个测试不通过，我们也希望能快速统计出缺陷的等级。 pytest结合allure框架可以对…

阅读更多...

YOLOv5项目实战（5）— 算法模型优化和服务器部署

YOLOv5项目实战（5）— 算法模型优化和服务器部署

前言：Hello大家好，我是小哥谈。近期，作者所负责项目中的算法模型检测存在很多误报情况，为了减少这种误报情况，作者一直在不断优化算法模型。鉴于此，本节课就给大家详细介绍一下实际工作场景中如何去优化算法模型和进行部署，另外为了方便大家进行模型训练，作者在文章中提…

阅读更多...

oracle FUNCTION（任意两个时间之间的工作小时）

oracle FUNCTION（任意两个时间之间的工作小时）

写函数计算任意两个时间之间的工作小时每天工作时间（8:00 - 20:00 共12小时），没有休息日 CREATE OR REPLACE FUNCTION SC_YD_DESI.CALCULATE_WORK_HOURS_FUNC (p_current_time IN DATE,p_order_time IN DATE ) RETURN NUMBER ASp_work_hou…

阅读更多...

AWS Remote Control ( Wi-Fi ) on i.MX RT1060 EVK - 1 “建立开发环境”

AWS Remote Control ( Wi-Fi ) on i.MX RT1060 EVK - 1 “建立开发环境”

这个系列的文章将叙述如何借由 NXP 的“evkmimxrt1060_aws_remote_control_wifi_nxp”这支 Sample Code，达到 NXP RT1060EVK 经由 U-Blox EVK-JODY-W263 将资讯传到 AWS 上，并可借由手机对 RT1060 EVK 的 LED 进行远端控制。整体架构如下图所示&#x…

阅读更多...

道可云会展元宇宙平台全新升级，打造3D沉浸式展会新模式

道可云会展元宇宙平台全新升级，打造3D沉浸式展会新模式

随着VR虚拟现实、人工智能、虚拟数字人等元宇宙技术的快速发展，各个行业正试图通过元宇宙技术寻求新的发展突破口，会展行业也不例外。会展作为经贸领域的重要产业形态，越来越多的企业和组织开始寻求通过元宇宙技术为展会赋能，以满…

阅读更多...

【EI会议征稿】第七届大数据与应用统计国际学术研讨会（ISBDAS 2024）

【EI会议征稿】第七届大数据与应用统计国际学术研讨会（ISBDAS 2024）

第七届大数据与应用统计国际学术研讨会（ISBDAS 2024） 2024 7th International Symposium on Big Data and Applied Statistics 第七届大数据与应用统计国际学术研讨会（ISBDAS 2024）定于2024年3月8-10日在中国上海举行。会议旨在…

阅读更多...

最小化安装 Neokylin7.0 用于搭建 Hadoop 集群

最小化安装 Neokylin7.0 用于搭建 Hadoop 集群

文章目录环境搭建背景虚拟机创建和环境配置安装过程注意事项虚拟机设置软件选择KOUMP系统分区网络和主机名打开以太网，并记录信息配置 IPv4修改主机名创建用户 hadoop完全分布式搭建-CSDN博客环境搭建背景为什么不从hadoop100或者hadoop101开始，而是…

阅读更多...

STM32CubeMx+MATLAB Simulink点灯程序

STM32CubeMx+MATLAB Simulink点灯程序

STM32CubeMxMATLAB点灯程序 ✨要想实现在MATLAB Simulink环境下使用STM32，前提是已经搭建好MATLAB环境并且安装了必要的Simulink插件，以及对应的STM32支持包。 🌿需要准备一块所安装支持包支持的STM32开发板. 🔖具体支持包详情页…

阅读更多...

社区医院儿童疫苗接种管理系统设计与开发

社区医院儿童疫苗接种管理系统设计与开发

社区医院儿童疫苗接种管理系统设计与开发摘要自建国以来我国一直注重于卫生健康的建设，而儿童的生命健康更得到重视。疫苗接种作为有效防御疾病的手段之一，一直被广泛应用在世界各地。目前，有相当一部分社区准备使用信息管理系统来进行优…

阅读更多...

tensorflow-gpu1.15 + win11 + RTX 4050环境配置

tensorflow-gpu1.15 + win11 + RTX 4050环境配置

组了一套，不知道行不行 windows11GPURTX 4050python3.7.12tensorflow-gpu1.15.0cudatoolkit10.0.130cudnn7.6.5Keras2.3.1

阅读更多...

Java强制类型转换的所有规则都在这里了

Java强制类型转换的所有规则都在这里了

💗推荐阅读文章💗 🌸JavaSE系列🌸👉1️⃣《JavaSE系列教程》🌺MySQL系列🌺👉2️⃣《MySQL系列教程》🍀JavaWeb系列🍀👉3️⃣《JavaWeb系列教程》…

阅读更多...

VR全景对旅游业有什么帮助，如何助力旅游业实现新的旅游形式

VR全景对旅游业有什么帮助，如何助力旅游业实现新的旅游形式

引言： 旅游业是一个充满机遇的行业，而虚拟现实（VR）全景技术正逐渐改变着旅游业的面貌，通过提供身临其境的体验，VR全景成为了旅游业的新宠，将旅游带入了一个全新的数字化时代。一、打破地域限制…

阅读更多...

最新文章