大模型ChatGLM-6B实现本地部署

大模型ChatGLM-6B实现本地部署

  • 一、写在前面:
  • 二、ChatGLM-6B下载:
  • 三、项目所需要的环境配置:
  • 四、项目运行:
  • 五、遇到的主要问题及解决

一、写在前面:

1、 确保你的电脑中已安装git,git lfs。
2、确保你的电脑满足以下任一一种配置:
(1)内存不低于32G,大显存显卡无要求。
(2)内存不低于16G,显存不低于8G。
3、若满足2(2),则请确保你的显卡驱动和cuda、cudnn已经安装,并且相互之间版本对应。若满足2(1),则跳过3往下看。

二、ChatGLM-6B下载:

下载主要下载两部分,项目代码下载和模型权重下载。

1、项目代码下载地址:https://github.com/THUDM/ChatGLM-6B/
2、模型权重下载:本次下载的时INT4量化的模型方法如下,按照以下三个步骤完成下载:
(1)第一步:模型依赖文件下载:
进出ChatGLM-6B目录下,运行以下命令(官方提供的命令中,镜像地址是:https://huggingface.co,而这个地址我们很难访问,所以,把这个镜像地址换成:https://hf-mirror.com,就变成了下面这条命令):

GIT_LFS_SKIP_SMUDGE=1 git clone https://hf-mirror.com/THUDM/chatglm-6b-int4

执行完成后在你当前目录下,会产生如下图所示的文件夹,文件夹中是加载模型的依赖文件。
在这里插入图片描述

(2)第二步:模型权重下载:
模型参数下载地址:https://cloud.tsinghua.edu.cn/d/674208019e314311ab5c/,进去之后,页面如下图所示,将蓝色框里面的文件全部下载下来。
在这里插入图片描述
(3)第三步:将第二步下载的所有文件,复制到第一步中所产生的文件夹(chatglm-6b-int4)中,就变成了如下这样:

在这里插入图片描述

三、项目所需要的环境配置:

常规操作,安装requirements.txt文件即可,命令如下:

pip install -r requirements.txt

四、项目运行:

在主项目目录下新建一个py文件,写入代码如下:

from transformers import AutoTokenizer, AutoModel
tokenizer = AutoTokenizer.from_pretrained("chatglm-6b-int4", trust_remote_code=True)
model = AutoModel.from_pretrained("chatglm-6b-int4", trust_remote_code=True).half().cuda()
model = model.eval()
response, history = model.chat(tokenizer, "你是谁", history=[])
print(response)

五、遇到的主要问题及解决

问题1:下载模型、模型配置文件时,官方提供的很多命令无法下载,愿意是官方提供的镜像地址是https://huggingface.co,我们无法访问。
解决:我找到了新的镜像地址:https://hf-mirror.com。将下载时链接地址里面有:https://huggingface.co的全部换成:https://hf-mirror.com。

问题2:启动项目时,有时会直接退出,这是因为你上次执行时,系统还没有释放资源,虽然你自己去看的时候已经释放资源了,其实没有释放完全。这种情况在windows中比较常见,Linux中从未遇到过。
解决:重新释放资源,或着重启。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/718959.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

浅析前端的堆栈原理以及深浅拷贝原理

浅析前端的堆栈原理以及深浅拷贝原理 首先来看一个案例 const obj {name:hzw,age:18 } let objName2 obj objName2.age 12 console.log(obj,objName2) // {name: hzw, age: 12} {name: hzw, age: 12}这里是不是很奇怪,为什么,为什么我改变objName2的…

AirPods Pro 2 耳机推送新固件,苹果Find My功能助力产品成长

苹果公司面向 AirPods Pro 2(包括 USB-C 和 Lightning 版本),推出了全新的测试版固件更新,版本号为 6E188,高于 12 月份发布的 6B34 固件。 苹果和往常一样,并没有提供详细的更新日志或者说明&#xff0c…

算法刷题day20:二分

目录 引言概念一、借教室二、分巧克力三、管道四、技能升级五、冶炼金属六、数的范围七、最佳牛围栏 引言 这几天一直在做二分的题,都是上了难度的题目,本来以为自己的二分水平已经非常熟悉了,没想到还是糊涂了一两天才重新想清楚&#xff0…

力扣区间题:合并区间、插入区间

我们可以将区间按照左端点升序排列,然后遍历区间进行合并操作。 我们先将第一个区间加入答案,然后依次考虑之后的每个区间: 如果答案数组中最后一个区间的右端点小于当前考虑区间的左端点,说明两个区间不会重合,因此…

Java基于springboot的课程作业管理系统

摘 要 随着科学技术的飞速发展,社会的方方面面、各行各业都在努力与现代的先进技术接轨,通过科技手段来提高自身的优势,课程作业管理系统当然也不能排除在外。课程作业管理系统是以实际运用为开发背景,运用软件工程原理和开发方法…

Linux常见命令总结

1.创建文件夹 mkdir 目录名 mkdir 文件夹名 创建单个文件夹 mkdir 文件夹1 文件夹2 文件夹3 创建多个文件夹 mkdir -p parent/child 创建多级文件夹 2.创建文件 touch 文件名 touch的主要功能有两个,如果要创建的文件的名称存在,将文件的创建时间修改到当前的系统时间(也…

五种常用的可视化项目管理工具

传统的项目管理通常依赖于文本文档,容易造成误解和混乱。在快节奏的商业环境中,没有哪个项目经理愿意处理繁重的文档流程。 另一方面,可视化项目管理通常使用图表和视觉板来展示复杂的项目信息。因此,项目经理能快速了解关键信息…

基于 rk3566 的 uboot 分析 - dts 加载和 dm 模型的本质

文章目录 一、设备树加载使用1、概述2、第一阶段1) fdtdec_setup2) 总结 3、第二阶段1) kernle dtb 编译打包2) 加载流程2.1) board_init2.2) init_kernel_dtb2.3) rockchip_read_dtb_file2.4) rockchip_read_resource_dtb 3) 总结 二、dm 模型1、树的创建1) device_bind_commo…

使用Matlab计算IGRAv2探空站的Tm和PWV

1. 探空站IGRAv2数据 探空站的Tm常作为真值,去检验Tm线性公式或者ERA5 Tm等的精度 。 探空站PWV常作为真值,去检验GNSS PWV等的精度 2. Tm 的计算方法 Tm 的计算方法有两种在前面的文章有讲,这里用 使用水汽压和温度计算Tm。 ei和 Ti 表示…

本地如何配置支付宝模拟支付场景并结合内网穿透实现公网环境调试开发?

文章目录 前言1. 下载当面付demo2. 修改配置文件3. 打包成web服务4. 局域网测试5. 内网穿透6. 测试公网访问7. 配置二级子域名8. 测试使用固定二级子域名访问 前言 在沙箱环境调试支付SDK的时候,往往沙箱环境部署在本地,局限性大,在沙箱环境…

还在犹豫学不学?鸿蒙技术是否有前途的最强信号来了

2024年3月3日 上午10 点,深圳官方账号发布了一篇关于鸿蒙技术发展的重要文章,看到这篇文章后我非常激动,忍不住和大家分享一下! 华为鸿蒙系统自提出以来,网友们的态度各不相同,有嘲笑“安卓套壳”的&#…

2024 CHINASHOP丨悠络客AI应用亮点抢鲜看,还有价值百元门票免费送哦!

3月13日-15日,备受国内外关注的第二十四届中国零售业博览会(2024 CHINASHOP)将在上海国家会展中心正式开展!悠络客作为深耕智慧门店15年的公有云人工智能企业,也将带着全新AI产品和智慧门店解决方案亮相展会&#xff0…

Windows系统中ollama下载模型前设置下载路径

Windows系统中ollama下载模型前设置下载路径 一开始设置了用户环境变量 OLLAMA_MODELS,没有效果 添加系统环境变量后,ollama pull和run的模型都到了环境变量中的路径下; 设置完后可以在cmd中检查一下:echo %ollama_models% ollam…

Electron 多显示器渲染

Electron打出的包,如果当前有俩个显示器,则可以配置当前显示倒哪个显示器上,或者可以配置不同的显示器,启动不同的项目,只在Windows和Linux下测试过,Mac没有真机,可以利用docker安装MacOS环境&a…

使用mapbox navigation搭建一个安卓导航 示例

一.代码示例地址: https://github.com/mapbox/mapbox-navigation-android-examples/tree/main 二. 具体步骤: git clone gitgithub.com:mapbox/mapbox-navigation-android-examples.git Go to app/src/main/res/values Look for mapbox_access_token.…

Sora:探索大型视觉模型的前世今生、技术内核及未来趋势

Sora,一款由OpenAI在2024年2月推出的创新性文生视频的生成式AI模型,能够依据文字说明,创作出既真实又富有想象力的场景视频,展现了其在模拟现实世界方面的巨大潜能。本文基于公开技术文档和逆向工程分析,全面审视了Sor…

pytorch(四)用pytorch实现线性回归

文章目录 代码过程准备数据设计模型设计构造函数与优化器训练过程训练代码和结果pytorch中的Linear层的底层原理(个人喜欢,不用看)普通矩阵乘法实现Linear层实现 回调机制 代码过程 训练过程: 准备数据集设计模型(用来…

国图公考:山东事业编考试即将开始

山东事业编考试时间为2024年3月10日-9.00-11.30分 考试科目为公基写作 准考证打印时间为2024年3月5日9.00-3月10日9.30分 准考证打印入口:山东考试信息网 综合类笔试在全省十六市均设置考点,参加考试的考生可凭借准考证和本人身份证参加笔试

Python爬虫实战(基础篇)—13获取《人民网》【最新】【国内】【国际】写入Word(附完整代码)

文章目录 专栏导读背景测试代码分析请求网址请求参数代码测试数据分析利用lxml+xpath进一步分析将获取链接再获取文章内容测试代码写入word完整代码总结专栏导读 🔥🔥本文已收录于《Python基础篇爬虫》 🉑🉑本专栏专门针对于有爬虫基础准备的一套基础教学,轻松掌握Py…

第 2 个 Java Web 应用工程(JSP JavaBean DB)(含源码)(图文版)

JavaBean 是一种符合特定约定的 Java 类,通常用于在 Java 应用程序中封装数据以及提供对数据的访问和修改方法。 本文示例:建立一个 Tomcat 工程,编写一个 JSP 页面,调用 JavaBean 访问数据库并显示到页面上,发布到 T…