大模型部署手记（1）ChatGLM2+Windows GPU

大模型部署手记（1）ChatGLM2+Windows GPU

news/2025/10/25 18:42:00/文章来源:https://blog.csdn.net/snmper/article/details/133578315

1.简介：

组织机构：智谱/清华

代码仓：https://github.com/THUDM/ChatGLM2-6B

模型：THUDM/chatglm2-6b

下载：https://huggingface.co/THUDM/chatglm2-6b

镜像下载：https://aliendao.cn/models/THUDM/chatglm2-6b

硬件环境：暗影精灵7Plus

Windows版本：Windows 11家庭中文版 Insider Preview 22H2

内存 32G

GPU显卡：Nvidia GTX 3080 Laptop （16G）

torch推荐使用 2.0 及以上的版本，以获得最佳的推理性能 :

nvidia-smi

CUDA是12.2版本。

nvcc -V

nvcc显示CUDA 11.6版本。

查看Nvidia控制面板：

2.代码和模型下载：

下载代码仓：

git clone https://github.com/THUDM/ChatGLM2-6B

浏览器打开 https://huggingface.co/THUDMM/chatglm2-6b/tree/main，选择 Files and versions，将所有文件都下载下来：

或者换这个地址：

https://cloud.tsinghua.edu.cn/d/674208019e314311ab5c/?p=%2Fchatglm2-6b&mode=list

或者换这个地址：

https://aliendao.cn/models/THUDM/chatglm2-6b

可以切换到Linux，执行以下命令，从镜像下载模型：

cd /home1/zhanghui/aliendao

python3 model_download.py --mirror --repo_id THUDM/chatglm2-6b

实验表明镜像站下载大的模型文件大概率还是会出现下载卡住的情形。

将下载好的文件移动到 /home1/zhanghui/ChatGLM2-6B/THUDM/chatglm2-6b 目录下（gitattributes文件可以改名为 .gitattributes)

将前面从Linux上下载好的ChatGLM2-6b的模型文件传到 D:\ChatGLM2-6B 目录下：

3.安装依赖

进入Anaconda提示符界面：

conda create -n torch2.0 python=3.8

conda activate torch2.0

d:

cd ChatGLM2-6B

安装pip依赖：

pip install -r requirements.txt

4.部署验证

启动:

python web_demo.py

修改 web_demo.py，将模型路径改为文件路径：

重试：

python web_demo.py

查看 https://betheme.net/qianduan/121637.html

降级一下transformers试试：

pip install transformers==4.26.1 -i https://pypi.tuna.tsinghua.edu.cn/simple

重试：

python web_demo.py

这个torch安装的是一个非GPU的版本啊。

参考：https://pytorch.org/get-started/locally/

安装GPU版本的pytorch:

pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118

重试：

python web_demo.py

错误还是一样的。

换种方法，使用conda方式安装pytorch 2.0.1 for CUDA 11.8版本：

conda install pytorch torchvision torchaudio pytorch-cuda=11.8 -c pytorch -c nvidia

安装的是pytorch2.0.1+torchvision 0.15.2

重试：

python web_demo.py

pip install chardet

重试：

python web_demo.py

终于启动起来了。

浏览器打开 http://127.0.0.1:7860

感觉有点奇怪，回答怎么没有呢？

换成streamlit方式启动试试吧：

streamlit run web_demo2.py

根据提示，使用浏览器打开 http://127.0.0.1:8501/

问两个问题吧：

回答的时候，GPU情况如下：

可以接着问：

好了，你知道得太多了。该睡觉了。

（全文完，谢谢阅读）

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/news/94987.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

很普通的四非生，保研破局经验贴

很普通的四非生，保研破局经验贴

推免之路个人情况简介夏令营深圳大学情况机试面试结果预推免湖南师范大学面试结果安徽大学面试结果北京科技大学笔试面试结果合肥工业大学南京航空航天大学面试结果暨南大学东北大学最终结果一些建议写在后面个人情况简介教育水平：某中医药院校的医学信息…

阅读更多...

.netCore .net5,6,7 存日志文件

.netCore .net5,6,7 存日志文件

如果你使用 .netCore及以上版本(.net5,.net6,.net7)... 系统默认自带日志中间件(log4net) 对,就是上次java 日志大漏洞的兄弟....... 控制台自动打印日志就是它的功劳现在我们想存日志文件,怎么办很简单. 1.在项目中添加日志配置文件文件名 : log4net.config 不能…

阅读更多...

uniapp echarts 适配H5与微信小程序

uniapp echarts 适配H5与微信小程序

文章目录前言一、修改 ec-canvas组件1.1 在ec-canvas组件methods中定义一个initChart方法1.2 用initChart全局替换this.ec.onInit1.3 监听数据变化1.4 ec-canvas完整代码参考二、H5 echarts组件三、供外部调用的组件外部调用组件 uni-chart代码使用uni-chart 前言接上文&…

阅读更多...

Discuz！X 3.4任意文件删除漏洞

Discuz！X 3.4任意文件删除漏洞

复现过程： 1.访问http://x.x.x/robots.txt（文件存在） 2.登录弱口令账号：admin密码：admin 3.来到个人设置页面找到自己的formhash： 4.点击保存，抓包来到这个参数：birthprovin…

阅读更多...

力扣 -- 879. 盈利计划（二维费用的背包问题）

力扣 -- 879. 盈利计划（二维费用的背包问题）

解题步骤： 参考代码： 未优化的代码： class Solution { public:int profitableSchemes(int n, int minProfit, vector<int>& group, vector<int>& profit) {//计划数int lengroup.size();//每一维都多开一行空间vector&…

阅读更多...

websocket逆向【python实现websocket拦截】

websocket逆向【python实现websocket拦截】

python实现websocket拦截前言一、拦截的优缺点优点：缺点：二、实现方法1.环境配置2.代码三、总结前言开发者工具F12，筛选ws后，websocket的消息是这样显示的，如何获取这里面的消息呢？以下是本篇文章正文内容一、拦截的优缺点主要讲解一下websocket拦截的实现，现在…

阅读更多...

使用Pytorch从零实现Vision Transformer

使用Pytorch从零实现Vision Transformer

在这篇文章中，我们将基于Pytorch框架从头实现Vision Transformer模型，并附录完整代码。 Vision Transformer（ViT）是一种基于Transformer架构的深度学习模型，用于处理计算机视觉任务。它将图像分割成小的图像块（patches），然后使用Transformer编码器来处理这些图像块。V…

阅读更多...

网络代理的多面应用：保障隐私、增强安全和数据获取

网络代理的多面应用：保障隐私、增强安全和数据获取

随着互联网的发展，网络代理在网络安全、隐私保护和数据获取方面变得日益重要。本文将深入探讨网络代理的多面应用，特别关注代理如何保障隐私、增强安全性以及为数据获取提供支持。 1. 代理服务器的基本原理代理服务器是一种位于客户端和目标服务器之间…

阅读更多...

VC++创建windows服务程序

VC++创建windows服务程序

目录 1.关于windows标准可执行程序和服务程序 2.服务相关整理 2.1 VC编写服务 2.2 服务注册 2.3 服务卸载 2.4 启动服务 2.5 关闭服务 2.6 sc命令 2.7 查看服务 3.标准程序 3.1 后台方式运行标准程序 3.2 查找进程 3.3 终止进程以前经常在Linux下编写服务器程序…

阅读更多...

【LeetCode热题100】--20.有效的括号

【LeetCode热题100】--20.有效的括号

20.有效的括号使用栈： class Solution {public boolean isValid(String s) {Stack<Character> stack new Stack<>();int num s.length();for(int i 0;i<num;i){char c s.charAt(i);if(c(||c[||c{){stack.push(c);}else if(stack.isEmpty() ||c…

阅读更多...

ubuntu终端中文显示改为英文显示

ubuntu终端中文显示改为英文显示

临时有效如果希望终端显示英文，可以在终端设置环境变量 export LC_ALLC 若希望取消环境变量 unset LC_ALL 实际是改变系统两个环境变量 $LANGUAGE 和 $LANG的值（可以用echo $LANG 来查看值） 永久有效； 1.打开终端&#xf…

阅读更多...

Lagrange插值法实验:求拉格朗日插值多项式和对应x的近似值matlab实现(内附代码)

Lagrange插值法实验:求拉格朗日插值多项式和对应x的近似值matlab实现(内附代码)

一、实验要求已知函数表： 求出Lagrange 插值多项式，并计算x1.2处的y的近似值。二、MATLAB代码求解多项式： X input(请输入横坐标向量X:\nX); % 获取用户输入的横坐标向量 Y input(请输入纵坐标向量Y:\nY); % 获取用户输入的纵坐标…

阅读更多...

Java 基于 SpringBoot+Vue 的留守儿童关爱网站

Java 基于 SpringBoot+Vue 的留守儿童关爱网站

文章目录 1.研究背景2. 技术栈3.系统分析4系统设计5系统的详细设计与实现5.1系统功能模块5.2管理员功能模块源码下载地址 1.研究背景以往的留守儿童爱心的管理，一般都是纸质文件来管理留守儿童爱心信息，传统的管理方式已经无法满足现代人们的需求&…

阅读更多...

[AOSP] [JNI] [Android] AOSP中使用JNI

[AOSP] [JNI] [Android] AOSP中使用JNI

一. 简要 🍎 JNI是Java Native Interface的缩写，它提供了若干的API实现了Java和其他语言的通信（主要是C&C）。从Java1.1开始，JNI标准成为java平台的一部分，它允许Java代码和其他语言写的代码进行交互。J…

阅读更多...

JVM篇---第三篇

JVM篇---第三篇

系列文章目录文章目录系列文章目录一、什么是Java虚拟机？为什么Java被称作是“平台无关的编程语言”？二、Java内存结构三、说说对象分配规则一、什么是Java虚拟机？为什么Java被称作是“平台无关的编程语言”？ Java虚拟机是一个可以执行Java字节码的虚拟机进程。Java源文…

阅读更多...

MSTP+VRRP配置

MSTP+VRRP配置

项目拓扑与项目需求项目需求:某公司内部为了实现高冗余性，部署了两台汇聚交换机，分别为LSW1、LSW2，AR1为公司的出口设备。公司内部有两个部门，分别划分在vlan10和vlan20。现在需要实现以下需求： 由于汇聚层和接入层…

阅读更多...

软考系统架构设计师系列知识点之软件架构风格（9）

软考系统架构设计师系列知识点之软件架构风格（9）

接前一篇文章：软考系统架构设计师系列知识点之软件架构风格（8） 这个十一注定是一个不能放松、保持“紧”的十一。由于报名了全国计算机技术与软件专业技术资格（水平）考试，11月4号就要考试，因此…

阅读更多...

[论文必备]最强科研绘图分析工具Origin（2）——简单使用教程

[论文必备]最强科研绘图分析工具Origin（2）——简单使用教程

本篇将介绍Origin的简单使用教程。安装教程见上篇：[论文必备]最强科研绘图分析工具Origin（1）——安装教程目录 📢一、工具栏介绍 📣1.1 行 1.1.1 标准栏 1.1.2 导入栏 1.1.3 工作表数据 1.1.4 图表数据 &a…

阅读更多...

使用Java NIO进行文件操作、网络通信和多路复用的案例

使用Java NIO进行文件操作、网络通信和多路复用的案例

Java NIO（New Input/Output）是Java提供的一种新的I/O操作方式，相较于传统的Java I/O API，它能够更加高效地处理大量的并发连接。本文将详细介绍Java NIO的核心组件，包括Channel、Buffer和Selector，以及其他…

阅读更多...

Linux下基本指令(上)

Linux下基本指令(上)

文章内容： 1. ls 指令语法： ls [选项][目录或文件] 功能：对于目录，该命令列出该目录下的所有子目录与文件。对于文件，将列出文件名以及其他信息。单个ls显示当前目录下的文件和目录常用选项&#…

阅读更多...

最新文章