佛山网站建设 奇锐科技/百度正版下载

佛山网站建设 奇锐科技,百度正版下载,网站首页页面代码,新网站怎么做优化AWS 相关核心概念 简洁地介绍一下AWS训练云服务的核心关联概念: AWS核心服务层: 基础设施层: EC2(计算), S3(存储), RDS(数据库)等人工智能层: SageMaker(训练平台), AI服务等 机器学习服务分级: 高层: 预构建AI服务(开箱即用)中层: SageMaker(主要训练平台)底层: 框架和基…

AWS 相关核心概念

简洁地介绍一下AWS训练云服务的核心关联概念:

  1. AWS核心服务层:
  • 基础设施层: EC2(计算), S3(存储), RDS(数据库)等
  • 人工智能层: SageMaker(训练平台), AI服务等
  1. 机器学习服务分级:
  • 高层: 预构建AI服务(开箱即用)
  • 中层: SageMaker(主要训练平台)
  • 底层: 框架和基础设施(最大自由度)
  1. SageMaker平台核心功能:
  • 开发: JupyterNotebook环境
  • 训练: 内置算法+自定义训练
  • 部署: 模型托管服务
  1. 基本工作流:
    数据准备(S3) → 开发(Notebook) → 训练(SageMaker) → 部署(Endpoints)

  2. 入口文档
    文档:https://docs.aws.amazon.com/zh_cn/

什么是EC2?(弹性云服务器)

Amazon Elastic Compute Cloud (Amazon EC2) 是一种提供可调节计算容量的 Web 服务 – 简单来说,就是 Amazon’s 数据中心内的服务器 – 您可以使用它来构建和托管您的软件系统。

Amazon Elastic Compute Cloud(Amazon EC2)在 Amazon Web Services(AWS)云中按需提供可扩展的计算容量。使用 Amazon EC2 可以降低硬件成本,因此您可以更快地开发和部署应用程序。您可以使用 Amazon EC2 启动所需数量的虚拟服务器,配置安全性和联网以及管理存储。您可以添加容量(纵向扩展)来处理计算密集型任务,例如月度或年度进程或网站流量峰值。如果使用量减少,您可以再次减少容量(缩减)。

EC2 实例是 AWS 云中的虚拟服务器。启动 EC2 实例时,您指定的实例类型决定了用于您的实例的主机硬件。每种实例类型以不同方式兼顾计算、内存、存储和网络资源。有关更多信息,请参阅 Amazon EC2 实例类型指南。
(下图右边是实例命名规则)
在这里插入图片描述
当前EC2支持的一些实例类型:在这里插入图片描述
更多可参考:https://aws.amazon.com/cn/ec2/instance-types/

什么是S3?(对象存储服务)

Amazon Simple Storage Service(Amazon S3)是一种对象存储服务,提供行业领先的可扩展性、数据可用性、安全性和性能。各种规模和行业的客户都可以使用 Amazon S3 存储和保护任意数量的数据,用于数据湖、网站、移动应用程序、备份和恢复、归档、企业应用程序、IoT 设备和大数据分析。Amazon S3 提供了管理功能,使您可以优化、组织和配置对数据的访问,以满足您的特定业务、组织和合规性要求。
详见:https://docs.aws.amazon.com/zh_cn/AmazonS3/latest/userguide/Welcome.html

什么是 Amazon SageMaker AI?(机器学习平台)

Amazon SageMaker AI 是一项完全托管的机器学习 (ML) 服务。借助 SageMaker AI,数据科学家和开发人员可以快速、自信地构建、训练 ML 模型并将其部署到可用于生产的托管环境中。它提供了运行 ML 工作流的 UI 体验,使 SageMaker AI ML 工具可在多个集成开发环境 (IDE) 中使用。

借助 SageMaker AI,您可以存储和共享数据,而无需构建和管理自己的服务器。这样,您或您的组织就有更多时间协作构建和开发 ML 工作流程,并更快地完成。SageMaker AI 提供托管 ML 算法,可在分布式环境中高效处理大量数据。SageMaker AI 内置对自带算法和框架的支持,可提供灵活的分布式训练选项,以适应您的特定工作流程。只需几个步骤,您就可以从 SageMaker AI 控制台将模型部署到安全且可扩展的环境中。

SageMaker平台核心功能:

  • 开发: JupyterNotebook环境
  • 训练: 内置算法+自定义训练
  • 部署: 模型托管服务

通俗来讲: 数据存在S3(硬盘)里,用SageMaker(实验室)处理数据训练模型,需要更多算力时,自动调用EC2(计算机)

pytorch 训练入门

写在前面,建议速读:
pytorch sagemaker入门训练文档
PyTorch 与 Amazon A SageMaker I 配合使用的资源

脚本训练:
使用sagemaker脚本模式创建你的训练
将 PyTorch 与 SageMaker Python SDK 结合使用

自定义镜像:
Building your own algorithm container
使用 SageMaker AI 自定义 Docker 容器
https://github.com/aws/deep-learning-containers/blob/master/available_images.md
dockerfile 编写入门

整体的逻辑图:
在这里插入图片描述

大白话总结:
Studio可以作为提交训练任务的入口,通过xx.ipynb作为提交任务的引子,比如以下PyTorch任务代码提交任务的流程是:
打包source_dir -> 在指定机器解压source -> 指定机器使用image_uri的运行环境 -> 执行 entry_point

from sagemaker.pytorch import PyTorch
from sagemaker import get_execution_role
role = get_execution_role()image_uri = 'xxxx.dkr.ecr.us-east-1.xxxx
job_name='deepll-train'#勿使用"",可使用"-"train_s3 = {
'model': sagemaker.inputs.TrainingInput(s3_data='s3://xxx-sagemakers/xx'),
'data': sagemaker.inputs.TrainingInput(s3_data='s3://xxxx-sagemaker/data/xxx')
}#任务声明
pytorch_estimator = PyTorch(base_job_name=job_name,source_dir="./train_dir", # 训练代码目录entry_point="train.py", # the entry point that launch,入口脚本role=role,image_uri=image_uri, #训练使用的python镜像instance_type="ml.p4d.24xlarge", #训练机器类型instance_count=1,# hyperparameters=hyperparameters, # 超参# distribution=distribution,# checkpoint_s3_uri = checkpoint_s3_uri,	# s3 checkpoint 位置,默认对应存储到训练image的 /opt/ml/checkpoints# checkpoint_local_path=checkpoint_local_path, # 临时存储目录)pytorch_estimator.fit(train_s3)

总的来说,在开发自己的训练任务之前,需要准备好3个模块:训练镜像、训练数据、调整训练代码

demo

创建 notebook 过程参考这里:创建 Amazon SageMaker 笔记本实例,这个我就不细讲了。

再重复一下一些重点概念:

  1. 核心组件
    SageMaker Studio/Notebook: 开发环境,类似 Jupyter Notebook
    Training Job: 训练任务
    S3: 数据存储服务,存放训练数据和模型
    IAM Role: 权限管理,控制访问权限
    ECR: 容器镜像仓库,存放训练环境镜像
  2. 关键参数解释
    entry_point: 训练脚本入口(比如 train.py)
    source_dir: 代码目录,会自动上传
    role: IAM角色,用于权限控制
    instance_type: 训练使用的机器类型(如 ml.p3.8xlarge)

接下来,我们从官方的一个pytorch简单用例(https://github.com/aws/amazon-sagemaker-examples/blob/main/sagemaker-python-sdk/pytorch_mnist/pytorch_mnist.ipynb)入手,快速熟悉使用流程:

# !yes | pip uninstall torchvison
# !pip install -qU torchvision
# !pip3 install -U sagemaker
# !pip3 install -U boto3
# !pip install sagemaker-studio-image-build

step1: 安装环境

在这里插入图片描述

step2: 初始化参数

在这里插入图片描述

step3: 获取数据

在这里插入图片描述

step4: 将数据传到 s3 上

在这里插入图片描述
通过 sagemaker_session.upload_data 接口,进行上传,也可以通过 aws 命令行指令。

step5: 准备训练脚本

在这里插入图片描述

from sagemaker.pytorch import PyTorchestimator = PyTorch(entry_point="mnist.py",role=role,py_version="py38",framework_version="1.11.0",instance_count=2,instance_type="ml.c5.2xlarge",hyperparameters={"epochs": 1, "backend": "gloo"},
)

step6: 开启训练

在这里插入图片描述
结束标志:

在这里插入图片描述

补充

训练数据输入方式

在这里插入图片描述

选择策略

在这里插入图片描述

Amazon A SageMaker I 管理的训练存储路径

下图显示了当您使用 SageMaker Python SDK 估算器类运行训练作业时 SageMaker AI 如何映射输入和输出路径的示例。
在这里插入图片描述
SageMaker AI 环境变量和训练存储位置的默认路径参考:https://docs.aws.amazon.com/zh_cn/sagemaker/latest/dg/model-train-storage-env-var-summary.html

更多相关:

dockerfile 编写入门
conda创建、查看、删除、重命名、迁移虚拟环境

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/73944.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

HTML图像标签的详细介绍

1. 常用图像格式 格式特点适用场景JPEG有损压缩,文件小,不支持透明适合照片、复杂图像PNG无损压缩,支持透明(Alpha通道)适合图标、需要透明背景的图片GIF支持动画,最多256色简单动画、低色彩图标WebP谷歌开…

内存高级话题

面试凉经,代码最近写的太少了,被面试官屠杀。 痛定思痛,对C新经典中的内存话题进行复现。 new A 与 new A() 的差别 (1)如果是一个空类,这两行代码没什么区别。当然现实中也没有程序员会写一个空类。 &am…

2025最全Xshell配置手册:从零开始下载安装搭建远程连接环境

🌈 软件介绍 Xshell 7 是由韩国 NetSarang 公司开发的一款功能强大的终端模拟器。它专为 Windows 操作系统设计,广泛应用于远程连接管理和服务器管理。 📥 软件下载与准备 1. 官方下载渠道(直接下载,安全无捆绑&…

算法模型从入门到起飞系列——广度优先遍历(BFS)

文章目录 前言一、广度优先遍历(BFS)简介1.1 广度优先遍历(BFS)的特点1.2 广度优先遍历(BFS)的要素 二、广度优先遍历(BFS)& 深度优先遍历(DFS)2.1 广度优…

CPP从入门到入土之类和对象Ⅱ

一、六大默认成员函数 默认成员函数是用户没有显式实现,编译器自动生成的成员函数。 一个类,我们在不写的情况下,编译器会默认生成六个默认成员函数 本文详细介绍构造函数和析构函数 二、构造函数 构造函数虽名为构造函数,但是…

【华三】路由器交换机忘记登入密码或super密码的重启操作

【华三】路由器交换机忘记登入密码或super密码的重启操作 背景步骤跳过认证设备:路由器重启设备翻译说明具体操作 跳过当前系统配置重启设备具体操作 背景 当console口的密码忘记,或者说本地用户的密码忘记,其实这时候是登入不了路由器的&am…

视图窗口的客户区

书籍:《Visual C 2017从入门到精通》的2.4.2 MFC应用程序类型 环境:visual studio 2022 内容:【例2.38】视图窗口的客户区 说明:以下内容大部分来自腾讯元宝。 1.创建一个单文档程序 一个简单的单文档程序-CSDN博客https://bl…

MySQL原理:逻辑架构

目的:了解 SQL执行流程 以及 MySQL 内部架构,每个零件具体负责做什么 理解整体架构分别有什么模块每个模块具体做什么 目录 1 服务器处理客户端请求 1.1 MySQL 服务器端逻辑架构说明 2 Connectors 3 第一层:连接层 3.1 数据库连接池(Conn…

当前企业使用VPN面临的不足和挑战

VPN的防护理念无法满足数字化转型的需求 古人云:知己知彼,百战不殆,既然要替换VPN,就要先了解VPN。VPN于1996年起源,98年首次在我国出现,历经25年的持续演进,直到现在依然广泛流行。VPN的起源背…

python中ord()和chr()转化ASCII数值+解密字符串例题

1.ASCII码简介 ASCII 即美国信息交换标准代码(American Standard Code for Information Interchange),是基于拉丁字母的一套电脑编码系统,主要用于显示现代英语和其他西欧语言。 发展历程:ASCII 码于 1963 年首次发布…

AMBA-CHI协议详解(二十五)

AMBA-CHI协议详解(一)- Introduction AMBA-CHI协议详解(二)- Channel fields / Read transactions AMBA-CHI协议详解(三)- Write transactions AMBA-CHI协议详解(四)- Other transac…

Web 小项目: 网页版图书管理系统

目录 最终效果展示 代码 Gitee 地址 1. 引言 2. 留言板 [热身小练习] 2.1 准备工作 - 配置相关 2.2 创建留言表 2.3 创建 Java 类 2.4 定义 Mapper 接口 2.5 controller 2.6 service 3. 图书管理系统 3.1 准备工作 - 配置相关 3.2 创建数据库表 3.2.1 创建用户表…

C语言每日一练——day_7

引言 针对初学者,每日练习几个题,快速上手C语言。第七天。(连续更新中) 采用在线OJ的形式 什么是在线OJ? 在线判题系统(英语:Online Judge,缩写OJ)是一种在编程竞赛中用…

ArcGIS10. 8简介与安装,附下载地址

目录 ArcGIS10.8 1. 概述 2. 组成与功能 3. 10.8 特性 下载链接 安装步骤 1. 安装准备 2. 具体步骤 3.补丁 其他版本安装 ArcGIS10.8 1. 概述 ArcGIS 10.8 是由美国 Esri 公司精心研发的一款功能强大的地理信息系统(GIS)平台。其核心功能在于…

Mac:JMeter 下载+安装+环境配置(图文详细讲解)

📌 下载JMeter 下载地址:https://jmeter.apache.org/download_jmeter.cgi 📌 无需安装 Apache官网下载 JMeter 压缩包,无需安装,下载解压后放到自己指定目录下即可。 按我自己的习惯,我会在用户 jane 目…

【PCB工艺】基础:电子元器件

电子原理图(Schematic Diagram)是电路设计的基础,理解电子元器件和集成电路(IC)的作用,是画好原理图的关键。 本专栏将系统讲解 电子元器件分类、常见 IC、电路设计技巧,帮助你快速掌握电子电路…

nvm 安装某个node.js版本后不能使用或者报错,或不能使用npm的问题

安装了nvm之后发现不能使用某个版本的node.js,报错之后,不能使用npm这个命令。可以这样解决: 1、再node.js官网直接下载node.js 的压缩包。 找到nvm的安装目录 2、直接将文件夹解压到这个安装目录中修改一下名字即可。

【MySQL数据库】多表查询(笛卡尔积现象,联合查询、内连接、左外连接、右外连接、子查询)-通过练习快速掌握法

在DQL的基础查询中,我们已经学过了多表查询的一种:联合查询(union)。本文我们将系统的讲解多表查询。 笛卡尔积现象 首先,我们想要查询emp表和stu表两个表,按照我们之前的知识栈,我们直接使用…

Java:Apache HttpClient中HttpRoute用法的介绍

当使用Apache HttpClient组件时,经常会用到它的连接池组件。典型的代码如下: PoolingHttpClientConnectionManager connectionManager new PoolingHttpClientConnectionManager();connectionManager.setMaxTotal(httpConfig.getMaxPoolTotal());connect…

RHCE(RHCSA复习:npm、dnf、源码安装实验)

七、软件管理 7.1 rpm 安装 7.1.1 挂载 [rootlocalhost ~]# ll /mnt total 0 drwxr-xr-x. 2 root root 6 Oct 27 21:32 hgfs[rootlocalhost ~]# mount /dev/sr0 /mnt #挂载 mount: /mnt: WARNING: source write-protected, mounted read-only. [rootlocalhost ~]# [rootlo…