【InternLM 实战营笔记】LMDeploy量化internlm2-chat-20b模型

【InternLM 实战营笔记】LMDeploy量化internlm2-chat-20b模型

news/2025/4/27 17:14:09/文章来源:https://blog.csdn.net/yichao_ding/article/details/136446783

准备环境

拉取环境

/root/share/install_conda_env_internlm_base.sh lmdeploy

激活环境

conda activate lmdeploy

安装依赖库

# 解决 ModuleNotFoundError: No module named 'packaging' 问题
pip install packaging
# 使用 flash_attn 的预编译包解决安装过慢问题
pip install /root/share/wheels/flash_attn-2.4.2+cu118torch2.0cxx11abiTRUE-cp310-cp310-linux_x86_64.whlpip install 'lmdeploy[all]==v0.2.4'

复制模型

cp -r /root/share/model_repos/internlm2-chat-20b/ /root/model/

INT4 权重量化

lmdeploy lite auto_awq \"/root/model/internlm2-chat-20b/" \--calib-dataset 'ptb' \--calib-samples 128 \--calib-seqlen 2048 \--w-bits 4 \--w-group-size 128 \--work-dir ./quant_output

使用控制台和模型对话

lmdeploy chat turbomind ./quant_output --model-format awq

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/news/722547.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

真机测试——关于荣耀Magic UI系列HBuilder真机调试检测不到解决办法

真机测试——关于荣耀Magic UI系列HBuilder真机调试检测不到解决办法

出现这种状况怎么办 1、开启USB调试 2、重点来了——我们要选择USB配置，选择音频来源 3、连接OK

阅读更多...

95.Go设计优雅的错误处理（带堆栈信息）

95.Go设计优雅的错误处理（带堆栈信息）

在之前的两篇文章中，我们已经介绍过错误的一些优雅处理 75.错误码设计、实现统一异常处理和封装统一返回结果 88.Go设计优雅的错误处理本文想继续写一篇，可以作为工具包直接使用。也是记录一种新的思路和编码技巧，同时创建错误的时候会自动…

阅读更多...

vue3基础教程（2）——创建vue3+vite项目

vue3基础教程（2）——创建vue3+vite项目

博主个人微信小程序已经上线：【中二少年工具箱】。欢迎搜索试用正文开始专栏简介1. 前言2.node版本检测3.创建vue项目专栏简介本系列文章由浅入深，从基础知识到实战开发，非常适合入门同学。零基础读者也能成功由本系列文章入门&#x…

阅读更多...

javascript数组排序的方法

javascript数组排序的方法

目录基本用法按照数字大小排序按照降序排序按照字符串长度排序按照对象属性排序在JavaScript中，数组排序通常使用Array.prototype.sort()方法。这个方法会按照指定的顺序对数组的元素进行排序，并返回排序后的数组。如果未指定比较函数&#x…

阅读更多...

Springboot配置MySQL数据库

Springboot配置MySQL数据库

Springboot配置MySQL数据库一、创建springboot项目，并添加如下依赖 <dependency><groupId>com.mysql</groupId><artifactId>mysql-connector-j</artifactId><scope>runtime</scope> </dependency>二、在applica…

阅读更多...

基于springboot+vue的酒店管理系统

基于springboot+vue的酒店管理系统

博主主页：猫头鹰源码博主简介：Java领域优质创作者、CSDN博客专家、阿里云专家博主、公司架构师、全网粉丝5万、专注Java技术领域和毕业设计项目实战，欢迎高校老师\讲师\同行交流合作主要内容：毕业设计(Javaweb项目|小程序|Pyt…

阅读更多...

实现session共享的方法总结完整版

实现session共享的方法总结完整版

文章目录实现session共享的方法总结完整版1、使用共享数据库：2、使用粘性会话（Sticky Session）：3、使用缓存系统：4、使用分布式文件系统：5、使用中央认证服务：6、使用会话复制：7、使…

阅读更多...

MongoDB聚合运算符：$dateFromParts

MongoDB聚合运算符：$dateFromParts

文章目录语法使用值域值大于范围值小于范围时区举例语法 {$dateFromParts : {year: <year>, month: <month>, day: <day>,hour: <hour>, minute: <minute>, second: <second>,millisecond: <ms>, timezone: <tzExpression>…

阅读更多...

100%开源大模型OLMo：代码/权重/数据集/训练全过程公开，重定义AI共享

100%开源大模型OLMo：代码/权重/数据集/训练全过程公开，重定义AI共享

前言近日，艾伦人工智能研究所联合多个顶尖学术机构发布了史上首个100%开源的大模型“OLMo”，这一举措被认为是AI开源社区的一大里程碑。OLMo不仅公开了模型权重，还包括了完整的训练代码、数据集和训练过程，为后续的开源工作设立…

阅读更多...

三星成功研发出业界首款12层堆叠HBM3E

三星成功研发出业界首款12层堆叠HBM3E

三星电子有限公司成功研发出业界首款12层堆叠HBM3E DRAM——HBM3E 12H，这是迄今为止容量最大的HBM产品。这款新型HBM3E 12H内存模块提供了高达1,280GB/s的史上最高带宽，并拥有36GB的存储容量，相较于之前的8层堆叠HBM3 8H，在带宽和…

阅读更多...

运维随录实战（1）

运维随录实战（1）

docker安装mongo 1，新建数据卷目录 mkdir -p /my/own/datadir 2，拉取镜像 docker pull mongo:latest 3，运行 docker run -d -p 27017:27017 -v /my/own/datadir:/data/db --name mongodb -e MONGO_INITDB_ROOT_USERNAME=admin -e MONGO_INITDB_ROOT_PASSWORD=123456 mongo …

阅读更多...

ECMAScript6

ECMAScript6

课程链接目录相关介绍什么是ECMA什么是ECMAScript为什么学习ES6 letconst变量解构赋值模板字符串对象简化写法箭头函数函数参数的默认值rest参数扩展运算符Symbol迭代器生成器函数与调用Promise介绍与基本用法Promise封装读取文件Promise.prototype...then方法Promise.catch…

阅读更多...

CCDP.01.寄主机SSH连接虚拟机的QA

CCDP.01.寄主机SSH连接虚拟机的QA

V0.0 初始版本-2024.2.29 检查VM的网卡配置如上图，如果enp0s3网卡没有出现形如10.0.0.??/24的ip配置，说明该网卡配置存在错误，或者没有“使能”该网卡。在RockyLinux8.X中可检查“ifcfg-enp0s？” vi /etc/sysconfig/network-…

阅读更多...

智能系统引领的未来时代

智能系统引领的未来时代

智能系统引领的未来时代随着人工智能技术的不断发展和普及，智能系统已经成为引领未来时代的关键力量。智能系统能够模拟人类的智能行为，实现自主学习、自主决策，并在各个领域展现出强大的应用潜力。在未来时代，智能系统将在各个…

阅读更多...

【Python 图像处理 PIL 系列 13.1 -- 从列表中读取图像数据并生成图像】

【Python 图像处理 PIL 系列 13.1 -- 从列表中读取图像数据并生成图像】

文章目录从列表中读取图像数据并生成图像代码示例从列表中读取图像数据并生成图像在Python中，可以使用Pillow库来创建和保存图像。这里我们将展示如何从列表list_num中读取RGB颜色数据，并根据row_num和column_num生成RGB格式的图像。安装Pillow库&…

阅读更多...

【JS】WebSocket实现简易聊天室

【JS】WebSocket实现简易聊天室

【JS】WebSocket实现简易聊天室聊天室思路示例聊天室思路聊天室思路 1、连接服务器先建立连接，默认生成匿名用户(admin01) 2、客户端发送消息，其它客户端用户都会同步接收消息(服务端接受消息广播所有连接用户) 3、客户端修改昵称，其它客…

阅读更多...

数据结构之七大排序

数据结构之七大排序

𝙉𝙞𝙘𝙚!!👏🏻‧✧̣̥̇‧✦👏🏻‧✧̣̥̇‧✦ 👏🏻‧✧̣̥̇:Solitary_walk ⸝⋆ ━━━┓ - 个性标签 - ：来于“云”的“羽球人”。…

阅读更多...

FreeRTOS操作系统学习——FreeRTOS工程创建

FreeRTOS操作系统学习——FreeRTOS工程创建

FreeROTS工程创建详细步骤如无特殊情况，大部人都要配置为外部高速时钟另外，本实验使用了FreeRTOS，FreeRTOS的时基使用的是Systick，而 STM32CubeMX中默认的HAL库时基也是Systick，为了避免可能的冲突，最…

阅读更多...

渗透测试工具 nmap 详解

渗透测试工具 nmap 详解

官网：Nmap: the Network Mapper - Free Security Scanner -p＜端口范围＞：仅扫描指定的端口用于扫描指定端口是否开放，在 -p 后输入指定的端口，以英文","进行拼接多个指定端口。 nmap -p 80&…

阅读更多...

2024年3月产品认证基础考试简答题及答案

2024年3月产品认证基础考试简答题及答案

产品认证基础 46.产品认证的工厂检查有哪几种路线？各有什么优缺点？ 答案：两种常用的检查路线： 1.按照要素或过程检查按照认证规则规定的工厂应满足的要素要求（包括质量保证能力要求），结合部…

阅读更多...

最新文章