[书生·浦语大模型实战营]——LMDeploy 量化部署 LLM 实践

[书生·浦语大模型实战营]——LMDeploy 量化部署 LLM 实践

news/2025/4/27 5:19:40/文章来源:https://blog.csdn.net/qq_41776136/article/details/139562784

1.基础作业

1.1配置 LMDeploy 运行环境

创建开发机

创建新的开发机，选择镜像Cuda12.2-conda；选择10% A100*1GPU；点击“立即创建”。注意请不要选择Cuda11.7-conda的镜像，新版本的lmdeploy会出现兼容性问题。其他和之前一样，不赘述。

创建conda环境

studio-conda -t lmdeploy -o pytorch-2.1.2

安装LMDeploy

#激活虚拟环境
conda activate lmdeploy
#安装0.3.0的imdeploy
pip install lmdeploy[all]==0.3.0

1.2以命令行方式与 InternLM2-Chat-1.8B 模型对话

在这里插入图片描述

2.进阶作业

2.1 设置KV Cache最大占用比例为0.4，开启W4A16量化，以命令行方式与模型对话。

在这里插入图片描述

2.2 以API Server方式启动 lmdeploy，开启 W4A16量化，调整KV Cache的占用比例为0.4，分别使用命令行客户端与Gradio网页客户端与模型对话。

命令行：
在这里插入图片描述

网页客户端：

2.3 使用W4A16量化，调整KV Cache的占用比例为0.4，使用Python代码集成的方式运行internlm2-chat-1.8b模型。

在这里插入图片描述

2.4 使用 LMDeploy 运行视觉多模态大模型 llava gradio demo。

在这里插入图片描述

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/news/850941.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

转型AI产品经理（6）：“ 序列位置效应”如何应用在Chatbot产品中

转型AI产品经理（6）：“ 序列位置效应”如何应用在Chatbot产品中

序列位置效应是心理学中的一个记忆现象，指的是人们对一系列信息的记忆效果受到信息在序列中位置的影响。具体来说，人们通常更容易记住列表的开头和结尾部分的项目，而对中间部分的项目记忆较差。这个效应可以进一步分为“首因效应”和“近因效…

阅读更多...

VSCode超过390万下载的请求插件

VSCode超过390万下载的请求插件

Thunder Client 是一款在 VSCode（Visual Studio Code）中非常受欢迎的 REST API 客户端插件，由Ranga Vadhineni开发，现在已经有超过390万的下载量。它允许开发者直接在编辑器内发送 HTTP 请求，查看响应。Thunder Client…

阅读更多...

006 CentOS 7.9 elasticsearch7.10.0安装及配置

006 CentOS 7.9 elasticsearch7.10.0安装及配置

Elasticsearch官方网址：https://www.elastic.co Elasticsearch中文官网地址：https://www.elastic.co/cn/products/elasticsearch https://www.elastic.co/cn/downloads/logstash https://www.elastic.co/cn/downloads/kibana https://dev.mysql.com/d…

阅读更多...

vue面试题二

vue面试题二

一、请解释Vue中的双向数据绑定是什么？ Vue中的双向数据绑定是一种机制，它使得数据的变化能够自动反映在用户界面上，同时用户界面中的输入也能够自动更新数据。这种机制实现了数据层（Model）和视图层（View&…

阅读更多...

设计模式的种类及其应用场景

设计模式的种类及其应用场景

设计模式可以大致分为以下几类：创建型模式、结构型模式和行为型模式。每一类设计模式都有其独特的特点和应用场景。下面我将对这三类设计模式进行详细说明，并介绍它们各自的应用场景。创建型模式创建型模式关注对象的创建过程，它抽象了实…

阅读更多...

更新pip版本（在自己工程中的虚拟环境中）

更新pip版本（在自己工程中的虚拟环境中）

D:\Program\PycharmProjects\guangdongprecipitation.venv\Scripts\python.exe -m pip install --upgrade pip -i https://pypi.tuna.tsinghua.edu.cn/simple D:\Program\PycharmProjects\guangdongprecipitation.venv\Scripts指的是属于guangdongprecipitation工程的python解释…

阅读更多...

C# WPF入门学习主线篇（十八）—— Border布局容器

C# WPF入门学习主线篇（十八）—— Border布局容器

C# WPF入门学习主线篇（十八）—— Border布局容器欢迎来到C# WPF入门学习系列的第十八篇。在前几篇文章中，我们已经探讨了 Canvas、StackPanel、WrapPanel、DockPanel、Grid 和 UniformGrid 布局容器及其使用方法。本篇博客将介绍另一种非常…

阅读更多...

Secure Boot 与 Android Verified Boot (AVB) 之间的关系与差异点

Secure Boot 与 Android Verified Boot (AVB) 之间的关系与差异点

标签： Secure Boot； AVB；Android Secure Boot 与 Android Verified Boot (AVB) 的关系、相同点和差异点概述 Secure Boot 和 Android Verified Boot (AVB) 都是用于保护设备启动过程和操作系统完整性的安全技术。虽然它们在设计和实现上有不同的重点和方式，但它们的共同…

阅读更多...

【冲刺秋招，许愿offer】第二天

【冲刺秋招，许愿offer】第二天

【冲刺秋招，许愿offer】第二天知识点每天emo小tips 知识点 final不可变性的原理可见性：当一个共享变量被声明为final时，每个线程都能看到这个变量的最新值。这是因为final变量的读取操作会直接从主内存中获取值，而不是从线程…

阅读更多...

简单介绍一下vim

简单介绍一下vim

简单介绍一下vim 一、vim是什么？二、vim的优点三、vi/vim的使用命令模式输入模式底线命令模式四、vi/vim 按键说明（一）命令模式可用的光标移动、复制粘贴、搜索替换等移动光标的方法:搜索替换的方法删除、复制与贴上的方法 （二&a…

阅读更多...

【算法】常用排序算法（插入排序、希尔排序、堆排序、选择排序、冒泡排序、快速排序、归并排序、计数排序）超详细

【算法】常用排序算法（插入排序、希尔排序、堆排序、选择排序、冒泡排序、快速排序、归并排序、计数排序）超详细

排序算法是数据结构相关知识中非常重要的一节，相信很多小伙伴对这部分知识一知半解。那么接下来，小编就要带领大家一起来进行对排序算法的深入剖析学习，希望本篇文章能够使你有所收获！ 一.常见的排序算法排序算法有很多种&#…

阅读更多...

Apache Spark MLlib机器学习详解

Apache Spark MLlib机器学习详解

Apache Spark MLlib 是 Spark 的一个核心组件，用于提供可扩展的机器学习算法库。MLlib 包含了各种常见的学习算法和实用程序，如分类、回归、聚类、协同过滤、降维等，以及底层的优化原语和高层次的管道API。以下是关于 Spark MLlib 的一些关…

阅读更多...

LINUX网络FTP服务

LINUX网络FTP服务

一、FTP服务 FTP服务：file transfer protocol :文件传输协议。在网络上进行双向传输，也是一个应用程序。不同的操作系统有不同的FTP软件，但使用的协议是一样的。 FTP协议基于TCP协议，有两个端口，即20和21。 20端口&…

阅读更多...

基于xml的Spring应用(理解spring注入)

基于xml的Spring应用(理解spring注入)

目录问题： 传统Javaweb开发的困惑? 问题： IOC、DI和AOP的思想提出问题： Spring框架的诞生 1. BeanFactory快速入门 2. ApplicationContext快速入门 3. BeanFactory和ApplicationContext的关系基于xml的Spring应用 1. SpringBean的…

阅读更多...

jmeter性能优化之mysql配置

jmeter性能优化之mysql配置

一、连接数据库和grafana 准备：连接好数据库和启动grafana并导入mysql模板大批量注册、登录、下单等，还有过节像618，双11和数据库交互非常庞大，都会存在数据库的某一张表里面，当用户在登录或者查询某一个界面时&…

阅读更多...

Java入门基础11：面向对象高级一（static、extends继承）

Java入门基础11：面向对象高级一（static、extends继承）

Java面向对象高级特性有以下几个：继承，多态，封装，抽象，接口，匿名内部类，静态成员，final关键字，异常处理等。我会将它分为三章详细讲，本章主要讲静态和继承 …

阅读更多...

算法导论实战（六）（算法导论习题三十四、三十五章）

算法导论实战（六）（算法导论习题三十四、三十五章）

🌈 个人主页：十二月的猫-CSDN博客 🔥 系列专栏： 🏀算法启示录 💪🏻 十二月的寒冬阻挡不了春天的脚步，十二点的黑夜遮蔽不住黎明的曙光前言算法导论的知识点学习将持续性更新在算…

阅读更多...

第十四周 6.4 内部类部分知识点

第十四周 6.4 内部类部分知识点

一、理解 1.定义在一个类内部的类称为内部类 2.语法: class 类名{ class 类名{} } 3.内部类编译之后生成独立的.class文件，文件命名为:外部类类名$内部类的类名.class 4.内部类分类:成员内部类、静…

阅读更多...

初阶《函数》 2.C语言中函数的分类

初阶《函数》 2.C语言中函数的分类

2.C语言中函数的分类 1.库函数 2.自定义函数 2.1 库函数为什么会有库函数？ 1.我们知道在我们学习C语言编程的时候，总是在一个代码编写完成之后迫不及待的想知道结果，想把这个结果打印到我们的屏幕上看看。这个时候我们会频繁的使用一个功能…

阅读更多...

Nginx04-Nginx代理、反向代理实验、LNMP流程详解与排错思路

Nginx04-Nginx代理、反向代理实验、LNMP流程详解与排错思路

目录写在前面Nginx04LNMP流程详解Nginx处理静态资源流程Nginx处理动态资源流程 LNMP排错LinuxNginxPHPMysql Nginx 代理概述正向代理反向代理区别反向代理实验（Proxy模块）环境准备front配置lb01配置测试流程梳理总结写在前面这是Nginx第四篇&#xf…

阅读更多...

最新文章