阿里云交互式建模（PAI-DSW）训练并微调推理ChatGLM模型

阿里云交互式建模（PAI-DSW）训练并微调推理ChatGLM模型

news/2025/4/27 0:32:49/文章来源:https://blog.csdn.net/qq_42108074/article/details/132912505

参考内容为《轻量微调和推理ChatGLM模型实践》

点击“交互式建模（DSW）”，然后选择“创建实例”
在这里插入图片描述

写上实例名称，然后选择GPU规格，选择“ecs.gn6v-c8g1.2xlarge(8 vCPU，32GB)”
在这里插入图片描述

页面往下拉选择“pytorch:1.12-gpu-py39-cu113-ubuntu20.04”这个官方镜像，然后点击下一步。
在这里插入图片描述

在确认订单这里点击创建实例。
在这里插入图片描述

等着状态是运行中，然后点击打开。
在这里插入图片描述

选择notebook中Python 3（ipykernel）。
在这里插入图片描述

进入到下边的页面。
在这里插入图片描述

import os
dsw_region = os.environ.get("dsw_region")
url_link = {"cn-shanghai": "https://atp-modelzoo-sh.oss-cn-shanghai-internal.aliyuncs.com/release/tutorials/chatGLM/ChatGLM-6B-main.tar.gz","cn-hangzhou": "https://atp-modelzoo.oss-cn-hangzhou-internal.aliyuncs.com/release/tutorials/chatGLM/ChatGLM-6B-main.tar.gz","cn-shenzhen": "https://atp-modelzoo-sz.oss-cn-shenzhen-internal.aliyuncs.com/release/tutorials/chatGLM/ChatGLM-6B-main.tar.gz","cn-beijing": "https://atp-modelzoo-bj.oss-cn-beijing-internal.aliyuncs.com/release/tutorials/chatGLM/ChatGLM-6B-main.tar.gz", 
}

执行上边代码获取当前地域的下载链接。
在这里插入图片描述

添加代码框。
在这里插入图片描述

path = url_link[dsw_region]
os.environ['LINK_CHAT'] = path
!wget $LINK_CHAT
!tar -xvf ChatGLM-6B-main.tar.gz

根据获取到的下载链接下载ChatGLM-6B数据。
在这里插入图片描述

!cd ChatGLM-6B-main && pip install -r requirements.txt && \
pip install rouge_chinese nltk jieba datasets

安装相关依赖。
在这里插入图片描述

执行完成之后：
在这里插入图片描述

!cd ChatGLM-6B-main/ptuning && wget https://atp-modelzoo-sh.oss-cn-shanghai.aliyuncs.com/release/tutorials/chatGLM/AdvertiseGen_Simple.zip && unzip AdvertiseGen_Simple.zip获取公共样例数据（AdvertiseGen_Simple）。
在这里插入图片描述

!cd ChatGLM-6B-main/ptuning && bash train.sh模型微调。生成的模型文件保存在./ChatGLM-6B-main/ptuning/chatglm-6b路径下。
在这里插入图片描述

!cd ChatGLM-6B-main/ptuning && bash evaluate.sh进行模型推理。
在这里插入图片描述

模型推理成功后，生成的推理结果保存在./ChatGLM-6B-main/ptuning/output/adgen-chatglm-6b-pt-8-1e-2/generated_predictions.txt。

鼠标点击对应目录两下。
在这里插入图片描述

鼠标点击web_demo.py两下。
在这里插入图片描述

图中圈中的部分都改成./ptuning/output/adgen-chatglm-6b-pt-8-1e-2/checkpoint-6，然后按下Ctrl+s进行保存。
在这里插入图片描述

点击“Untitled.ipynb”。
在这里插入图片描述

!pwd看一下当前目录，!ls -l看一下当前目录里边的内容。
在这里插入图片描述

!cd ChatGLM-6B-main/ && python web_demo.py进入到目录里边，然后启动ChatGLM Web端，可以点击http://127.0.0.1:7860。
在这里插入图片描述

显示页面如下图：
在这里插入图片描述

问它“什么是ChatGPT中的GPT？”，然后点击Generate。
在这里插入图片描述

在控制台点击删除。
在这里插入图片描述
选择删除实例。

删除完成之后如下图：
在这里插入图片描述

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/news/82425.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

力扣刷题：寻找两个正序数组的中位数、最长回文子串

力扣刷题：寻找两个正序数组的中位数、最长回文子串

今日刷题又开始了一、寻找两个正序数组的中位数题目链接：https://leetcode.cn/problems/median-of-two-sorted-arrays/ 给定两个大小分别为 m 和 n 的正序（从小到大）数组 nums1 和 nums2。请你找出并返回这两个正序数组的中位数。算法…

阅读更多...

常见的内网穿透工具有 ngrok/ localtunnel/ frp

常见的内网穿透工具有 ngrok/ localtunnel/ frp

1.内网穿透工具的工作原理内网穿透工具的工作原理是通过在本地网络和公共网络之间建立一个通道，将公网流量转发到本地网络中的服务。这样，在没有公网 IP 或无法直接访问的情况下，用户可以通过公网访问本地网络中的服务。 2. 常见的内网穿透…

阅读更多...

Leetcode162. 寻找峰值

Leetcode162. 寻找峰值

力扣（LeetCode）官网 - 全球极客挚爱的技术成长平台峰值元素是指其值严格大于左右相邻值的元素。给你一个整数数组 nums，找到峰值元素并返回其索引。数组可能包含多个峰值，在这种情况下，返回任何一个峰值所在位置即…

阅读更多...

Spring Boot 发送邮件

Spring Boot 发送邮件

Spring Boot 发送邮件准备工作引入依赖邮箱开启SMTP三方登录授权配置邮件服务器发送邮件普通文本邮件复杂邮件准备工作引入依赖 <dependency><groupId>org.springframework.boot</groupId><artifactId>spring-boot-starter-mail</artifactId&…

阅读更多...

物理内存分配

物理内存分配

目录内核物理内存分配接口内存分配行为（物理上） 内存分配的行为操作内存三个水位线水线计算水位线影响内存分配行为内存分配核心__alloc_pages 释放页 1、内核物理内存分配接口 struct page *alloc_pages(gfp_t gfp, unsigned int ord…

阅读更多...

Redis 三种特殊的数据类型 - Geospatial地理位置 - Hyperloglog基数统计的算法 - Bitmaps位图（位存储）

Redis 三种特殊的数据类型 - Geospatial地理位置 - Hyperloglog基数统计的算法 - Bitmaps位图（位存储）

目录 Redis 三种特殊的数据类型： Geospatial：地理位置 Geospatial类型常用的命令： GEOADD：添加地理位置 GEOPOS：获取地理位置 GEODIST：返回两个给定位置之间的距离 GEORADIUS：以给定的经纬…

阅读更多...

Window server 2008服务器，think-queue自动断开，宝塔redis爬坑记录

Window server 2008服务器，think-queue自动断开，宝塔redis爬坑记录

Window server 2008服务器，think-queue自动断开，宝塔redis爬坑记录排查原因问题解决坑爹记录：错误应用程序名称: redis-server.exe，版本: 0.0.0.0，时间戳: 0x5a604657 错误模块名称: redis-server.exe，版本: 0.0.0.0，时间戳: 0x5a604657 异常代码: 0xc0000005 错误偏…

阅读更多...

Seata 源码篇之AT模式启动流程 - 上 - 02

Seata 源码篇之AT模式启动流程 - 上 - 02

Seata 源码篇之AT模式启动流程 - 02 自动配置两个关键点初始化初始化TM初始化RM初始化TC 全局事务执行流程TM 发起全局事务GlobalTransactional 注解处理全局事务的开启 TM 和 RM 执行分支事务IntroductionDelegatingIntroductionInterceptorDelegatePerTargetObjectIntroduct…

阅读更多...

java手写并查集算法应用拓展案例

java手写并查集算法应用拓展案例

Java手写并查集算法应用拓展案例 1. 并查集算法应用思路并查集是一种用于处理不相交集合的数据结构，它支持合并（union）和查找（find）两种操作。并查集常用于解决集合合并、连通性问题等。并查集算法的应用拓展案例主…

阅读更多...

在华为云服务器上CentOS 7安装单机版Redis

在华为云服务器上CentOS 7安装单机版Redis

https://redis.io/是官网地址。点击右上角的Download。可以进入https://redis.io/download/——Redis官网下载最新版的网址。然后在https://redis.io/download/页面往下拉，点击下图超链接这里。进入https://download.redis.io/releases/下载自己需要的安装…

阅读更多...

【C语言】自定义类型：结构体【结构体内存具详细】，枚举，联合

【C语言】自定义类型：结构体【结构体内存具详细】，枚举，联合

目录一、结构体 1.结构的声明 2.特殊的声明 3.结构的自引用 4.结构体变量的定义和初始化 5.结构体内存对齐（重点来了） 6.为什么会存在内存对齐 7.修改默认对齐数 8.结构体传参二、位段 1.什么是位段 2.位段的内存分配 3.位段的跨平台问题…

阅读更多...

ajax day4

ajax day4

1、promise链式调用 /*** 目标：把回调函数嵌套代码，改成Promise链式调用结构* 需求：获取默认第一个省，第一个市，第一个地区并展示在下拉菜单中*/let pname axios({url: http://hmajax.itheima.net/api/province,}).t…

阅读更多...

21天学会C++：Day11----运算符重载

21天学会C++：Day11----运算符重载

CSDN的uu们，大家好。这里是C入门的第十一讲。座右铭：前路坎坷，披荆斩棘，扶摇直上。博客主页： 姬如祎收录专栏：C专题目录 1. 知识引入 2. 运算符重载 2.1 operator<() 2.2 operator() 2.3 o…

阅读更多...

jvm中对象创建、内存布局以及访问定位

jvm中对象创建、内存布局以及访问定位

对象创建 Java语言层面，创建对象通常（例外：复制、反序列化）仅仅是一个new关键字即可，而在虚拟机中，对象（限于普通Java对象，不包括数组和Class对象等）的创建又是怎样一个过…

阅读更多...

寄存器介绍

寄存器介绍

目录寄存器的概念寄存器工作原理寄存器的状态查看寄存器信息寄存器复位大空间寄存器复位寄存器的概念寄存器是计算机中一种临时存储数据的硬件设备，通常是高速缓存的一部分，用于存储、读取和操作计算机内部的数据。它们是计算机中最快的存…

阅读更多...

小米华为，化干戈为玉帛！

小米华为，化干戈为玉帛！

近日来，手机圈又掀起了各大厂家推出新品的高潮。首先是华为Mate60的推出，其自研的麒麟9000S芯片瞬间点燃了国内手机市场，得到了国内甚至国外业界人士的认可和好评。而近日网上盛传的小米创始人雷军的“愿意加入华为技术生态圈”的邀请&…

阅读更多...

AtCoder ARC106 E Hall 定理 + 二分 + 容斥原理 + 高维前后缀和

AtCoder ARC106 E Hall 定理 + 二分 + 容斥原理 + 高维前后缀和

题意传送门 AtCoder ARC106 E Medals 题解问题可以转化为每一天与职员之间的匹配问题，思路与 AtCoder ABC320 G Slot Strategy 2 (Hard) 类似。但二分图规模过大，直接求解最大匹配显然难以胜任。根据 Hall 定理，若二分图一侧点集 S S…

阅读更多...

JS操作字符串方法学习系列（4）-每天学习10个方法

JS操作字符串方法学习系列（4）-每天学习10个方法

目录 **字符串编码 (encodeURIComponent 和 decodeURIComponent)**:**字符串转换为日期 (Date Parsing)**:**字符串模板引擎 (Template Engines)**:**字符串替换所有匹配项 (replaceAll)**:**字符串分隔并限制 (String.prototype.split)**:**字符串转义字符 (Escape Characters…

阅读更多...

Redis缓存实现及其常见问题解决方案

Redis缓存实现及其常见问题解决方案

随着互联网技术的发展，数据处理的速度和效率成为了衡量一个系统性能的重要指标。在众多的数据处理技术中，缓存技术以其出色的性能优化效果，成为了不可或缺的一环。而在众多的缓存技术中，Redis 以其出色的性能和丰富的功能&#xf…

阅读更多...

JDK jps命令复习

JDK jps命令复习

之前写过jdk命令工具的博文，下面复习jps命令； jps 是 Java Process Status Tool 的简称,它的作用是为了列出所有正在运行中的 Java 虚拟机进程和相关信息； jps 命令参数 -q 只输出进程 ID,省略主类的名称 -m 输出虚拟机进程启动时传递…

阅读更多...

最新文章