大模型ChatGLM-6B实现本地部署

大模型ChatGLM-6B实现本地部署

  • 一、写在前面:
  • 二、ChatGLM-6B下载:
  • 三、项目所需要的环境配置:
  • 四、项目运行:
  • 五、遇到的主要问题及解决

一、写在前面:

1、 确保你的电脑中已安装git,git lfs。
2、确保你的电脑满足以下任一一种配置:
(1)内存不低于32G,大显存显卡无要求。
(2)内存不低于16G,显存不低于8G。
3、若满足2(2),则请确保你的显卡驱动和cuda、cudnn已经安装,并且相互之间版本对应。若满足2(1),则跳过3往下看。

二、ChatGLM-6B下载:

下载主要下载两部分,项目代码下载和模型权重下载。

1、项目代码下载地址:https://github.com/THUDM/ChatGLM-6B/
2、模型权重下载:本次下载的时INT4量化的模型方法如下,按照以下三个步骤完成下载:
(1)第一步:模型依赖文件下载:
进出ChatGLM-6B目录下,运行以下命令(官方提供的命令中,镜像地址是:https://huggingface.co,而这个地址我们很难访问,所以,把这个镜像地址换成:https://hf-mirror.com,就变成了下面这条命令):

GIT_LFS_SKIP_SMUDGE=1 git clone https://hf-mirror.com/THUDM/chatglm-6b-int4

执行完成后在你当前目录下,会产生如下图所示的文件夹,文件夹中是加载模型的依赖文件。
在这里插入图片描述

(2)第二步:模型权重下载:
模型参数下载地址:https://cloud.tsinghua.edu.cn/d/674208019e314311ab5c/,进去之后,页面如下图所示,将蓝色框里面的文件全部下载下来。
在这里插入图片描述
(3)第三步:将第二步下载的所有文件,复制到第一步中所产生的文件夹(chatglm-6b-int4)中,就变成了如下这样:

在这里插入图片描述

三、项目所需要的环境配置:

常规操作,安装requirements.txt文件即可,命令如下:

pip install -r requirements.txt

四、项目运行:

在主项目目录下新建一个py文件,写入代码如下:

from transformers import AutoTokenizer, AutoModel
tokenizer = AutoTokenizer.from_pretrained("chatglm-6b-int4", trust_remote_code=True)
model = AutoModel.from_pretrained("chatglm-6b-int4", trust_remote_code=True).half().cuda()
model = model.eval()
response, history = model.chat(tokenizer, "你是谁", history=[])
print(response)

五、遇到的主要问题及解决

问题1:下载模型、模型配置文件时,官方提供的很多命令无法下载,愿意是官方提供的镜像地址是https://huggingface.co,我们无法访问。
解决:我找到了新的镜像地址:https://hf-mirror.com。将下载时链接地址里面有:https://huggingface.co的全部换成:https://hf-mirror.com。

问题2:启动项目时,有时会直接退出,这是因为你上次执行时,系统还没有释放资源,虽然你自己去看的时候已经释放资源了,其实没有释放完全。这种情况在windows中比较常见,Linux中从未遇到过。
解决:重新释放资源,或着重启。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/718959.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

浅析前端的堆栈原理以及深浅拷贝原理

浅析前端的堆栈原理以及深浅拷贝原理 首先来看一个案例 const obj {name:hzw,age:18 } let objName2 obj objName2.age 12 console.log(obj,objName2) // {name: hzw, age: 12} {name: hzw, age: 12}这里是不是很奇怪,为什么,为什么我改变objName2的…

Hierarchical Text-ConditionalImage Generation with CLIP Latents笔记

1 Title Hierarchical Text-Conditional Image Generation with CLIP Latents(Aditya Ramesh、Prafulla Dhariwal、Alex Nichol、Casey Chu、Mark Chen) 2 Conclusion Contrastive models like CLIP have been shown to learn robust representations …

read()函数

read() 函数用于从文件描述符&#xff08;通常是套接字、文件等&#xff09;读取数据。 #include <unistd.h>ssize_t read(int fd, void *buf, size_t count);fd&#xff1a; 是文件描述符&#xff0c;可以是套接字、文件等。 buf&#xff1a; 是一个指向要读取数据的缓…

AirPods Pro 2 耳机推送新固件,苹果Find My功能助力产品成长

苹果公司面向 AirPods Pro 2&#xff08;包括 USB-C 和 Lightning 版本&#xff09;&#xff0c;推出了全新的测试版固件更新&#xff0c;版本号为 6E188&#xff0c;高于 12 月份发布的 6B34 固件。 苹果和往常一样&#xff0c;并没有提供详细的更新日志或者说明&#xff0c…

算法刷题day20:二分

目录 引言概念一、借教室二、分巧克力三、管道四、技能升级五、冶炼金属六、数的范围七、最佳牛围栏 引言 这几天一直在做二分的题&#xff0c;都是上了难度的题目&#xff0c;本来以为自己的二分水平已经非常熟悉了&#xff0c;没想到还是糊涂了一两天才重新想清楚&#xff0…

力扣区间题:合并区间、插入区间

我们可以将区间按照左端点升序排列&#xff0c;然后遍历区间进行合并操作。 我们先将第一个区间加入答案&#xff0c;然后依次考虑之后的每个区间&#xff1a; 如果答案数组中最后一个区间的右端点小于当前考虑区间的左端点&#xff0c;说明两个区间不会重合&#xff0c;因此…

Java基于springboot的课程作业管理系统

摘 要 随着科学技术的飞速发展&#xff0c;社会的方方面面、各行各业都在努力与现代的先进技术接轨&#xff0c;通过科技手段来提高自身的优势&#xff0c;课程作业管理系统当然也不能排除在外。课程作业管理系统是以实际运用为开发背景&#xff0c;运用软件工程原理和开发方法…

js跳出循环

只有for可以自己跳出循环 break可以退出多重循环&#xff0c;可以自行选择退出哪一层 label: for (let i 0; i < arr.length; i) {if (arr[i].content) {break label}console.log(i) } label1: for (let i 0; i < arr.length; i) {label2: for (let j 0; j < arr.l…

Linux常见命令总结

1.创建文件夹 mkdir 目录名 mkdir 文件夹名 创建单个文件夹 mkdir 文件夹1 文件夹2 文件夹3 创建多个文件夹 mkdir -p parent/child 创建多级文件夹 2.创建文件 touch 文件名 touch的主要功能有两个,如果要创建的文件的名称存在,将文件的创建时间修改到当前的系统时间(也…

五种常用的可视化项目管理工具

传统的项目管理通常依赖于文本文档&#xff0c;容易造成误解和混乱。在快节奏的商业环境中&#xff0c;没有哪个项目经理愿意处理繁重的文档流程。 另一方面&#xff0c;可视化项目管理通常使用图表和视觉板来展示复杂的项目信息。因此&#xff0c;项目经理能快速了解关键信息…

基于 rk3566 的 uboot 分析 - dts 加载和 dm 模型的本质

文章目录 一、设备树加载使用1、概述2、第一阶段1) fdtdec_setup2) 总结 3、第二阶段1) kernle dtb 编译打包2) 加载流程2.1) board_init2.2) init_kernel_dtb2.3) rockchip_read_dtb_file2.4) rockchip_read_resource_dtb 3) 总结 二、dm 模型1、树的创建1) device_bind_commo…

使用Matlab计算IGRAv2探空站的Tm和PWV

1. 探空站IGRAv2数据 探空站的Tm常作为真值&#xff0c;去检验Tm线性公式或者ERA5 Tm等的精度 。 探空站PWV常作为真值&#xff0c;去检验GNSS PWV等的精度 2. Tm 的计算方法 Tm 的计算方法有两种在前面的文章有讲&#xff0c;这里用 使用水汽压和温度计算Tm。 ei和 Ti 表示…

本地如何配置支付宝模拟支付场景并结合内网穿透实现公网环境调试开发?

文章目录 前言1. 下载当面付demo2. 修改配置文件3. 打包成web服务4. 局域网测试5. 内网穿透6. 测试公网访问7. 配置二级子域名8. 测试使用固定二级子域名访问 前言 在沙箱环境调试支付SDK的时候&#xff0c;往往沙箱环境部署在本地&#xff0c;局限性大&#xff0c;在沙箱环境…

项目管理,如何做到流程标准化?

在项目管理的流程中&#xff0c;每个阶段都有自己的起止范围&#xff0c;有本阶段的输入文件和本阶段要产生的输出文件。 同时&#xff0c;每个阶段都有本阶段的控制关口&#xff0c;即本阶段完成时将产生的重要文件也是进入下一阶段的重要输入文件。每个阶段完成时一定要通过…

还在犹豫学不学?鸿蒙技术是否有前途的最强信号来了

2024年3月3日 上午10 点&#xff0c;深圳官方账号发布了一篇关于鸿蒙技术发展的重要文章&#xff0c;看到这篇文章后我非常激动&#xff0c;忍不住和大家分享一下&#xff01; 华为鸿蒙系统自提出以来&#xff0c;网友们的态度各不相同&#xff0c;有嘲笑“安卓套壳”的&#…

2024 CHINASHOP丨悠络客AI应用亮点抢鲜看,还有价值百元门票免费送哦!

3月13日-15日&#xff0c;备受国内外关注的第二十四届中国零售业博览会&#xff08;2024 CHINASHOP&#xff09;将在上海国家会展中心正式开展&#xff01;悠络客作为深耕智慧门店15年的公有云人工智能企业&#xff0c;也将带着全新AI产品和智慧门店解决方案亮相展会&#xff0…

Tomcat核心组件概述

Tomcat是一个免费的开放源代码的Web应用服务器&#xff0c;属于轻量级应用服务器&#xff0c;在中小型系统和并发访问用户不是很多的场合下被普遍使用&#xff0c;是开发和调试JSP程序的首选。Tomcat技术先进、性能稳定&#xff0c;而且免费&#xff0c;因而深受Java爱好者的喜…

Windows系统中ollama下载模型前设置下载路径

Windows系统中ollama下载模型前设置下载路径 一开始设置了用户环境变量 OLLAMA_MODELS&#xff0c;没有效果 添加系统环境变量后&#xff0c;ollama pull和run的模型都到了环境变量中的路径下&#xff1b; 设置完后可以在cmd中检查一下&#xff1a;echo %ollama_models% ollam…

PySide6实现注册,登录流程

目录 一:实现思路 二:代码实现 三:完整代码和界面 一:实现思路 设计三个窗口界面,运行程序,打开注册界面,填写用户名和密码,信息填写完整,校验通过,插入数据库。跳转到登录界面,输入用户名和密码,校验通过跳转到主界面。

Electron 多显示器渲染

Electron打出的包&#xff0c;如果当前有俩个显示器&#xff0c;则可以配置当前显示倒哪个显示器上&#xff0c;或者可以配置不同的显示器&#xff0c;启动不同的项目&#xff0c;只在Windows和Linux下测试过&#xff0c;Mac没有真机&#xff0c;可以利用docker安装MacOS环境&a…