书生大模型实战营第三期基础岛第二课——8G 显存玩转书生大模型 Demo

8G 显存玩转书生大模型 Demo

      • 基础任务
      • 进阶作业一:
      • 进阶作业二:

基础任务

  • 使用 Cli Demo 完成 InternLM2-Chat-1.8B 模型的部署,并生成 300 字小故事,记录复现过程并截图。

创建conda环境

# 创建环境
conda create -n demo python=3.10 -y
# 激活环境
conda activate demo
# 安装 torch
conda install pytorch==2.1.2 torchvision==0.16.2 torchaudio==2.1.2 pytorch-cuda=12.1 -c pytorch -c nvidia -y

在这里插入图片描述

创建文件夹DEMO存放课程相关的文件

mkdir DEMO
cd DEMO

创建requirements.txt,写入依赖包

transformers==4.38
sentencepiece==0.1.99
einops==0.8.0
protobuf==5.27.2
accelerate==0.33.0
streamlit==1.37.0

安装依赖包

pip install -r requirements.txt

在这里插入图片描述
创建cli_demo.py

touch cli_demo.py

将以下代码复制到cli_demo.py中

import torch
from transformers import AutoTokenizer, AutoModelForCausalLMmodel_name_or_path = "/root/share/new_models/Shanghai_AI_Laboratory/internlm2-chat-1_8b"tokenizer = AutoTokenizer.from_pretrained(model_name_or_path, trust_remote_code=True, device_map='cuda:0')
model = AutoModelForCausalLM.from_pretrained(model_name_or_path, trust_remote_code=True, torch_dtype=torch.bfloat16, device_map='cuda:0')
model = model.eval()system_prompt = """You are an AI assistant whose name is InternLM (书生·浦语).
- InternLM (书生·浦语) is a conversational language model that is developed by Shanghai AI Laboratory (上海人工智能实验室). It is designed to be helpful, honest, and harmless.
- InternLM (书生·浦语) can understand and communicate fluently in the language chosen by the user such as English and 中文.
"""messages = [(system_prompt, '')]print("=============Welcome to InternLM chatbot, type 'exit' to exit.=============")while True:input_text = input("\nUser  >>> ")input_text = input_text.replace(' ', '')if input_text == "exit":breaklength = 0for response, _ in model.stream_chat(tokenizer, input_text, messages):if response is not None:print(response[length:], flush=True, end="")length = len(response)

在这里插入图片描述
然后就可以DEMO,启动

python cli_demo.py

生成300字的小故事
在这里插入图片描述

进阶作业一:

  • 使用 LMDeploy 完成 InternLM-XComposer2-VL-1.8B 的部署,并完成一次图文理解对话,记录复现过程并截图。

安装lmdeploy

pip install lmdeploy[all]==0.5.1
pip install timm==1.0.7

在这里插入图片描述
部署xcomposer

lmdeploy serve gradio /share/new_models/Shanghai_AI_Laboratory/internlm-xcomposer2-vl-1_8b --cache-max-entry-count 0.1

在这里插入图片描述
部署完成
在这里插入图片描述
在浏览器上访问 http://localhost:6006/ 体验xcomposer
在这里插入图片描述
在这里插入图片描述

进阶作业二:

  • 使用 LMDeploy 完成 InternVL2-2B 的部署,并完成一次图文理解对话,记录复现过程并截图。

因为依赖前面已经安装过了,所以直接部署
部署IntenVL2-2B

lmdeploy serve gradio /share/new_models/OpenGVLab/InternVL2-2B --cache-max-entry-count 0.1

在这里插入图片描述
在浏览器上访问 http://localhost:6006/ 体验internVL2-2B
在这里插入图片描述
在这里插入图片描述
对比xcomposer,internVL2-2B不知道就是不知道,不会编个答案
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/877762.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

[Meachines] [Easy] Legacy nmap 漏洞扫描脚本深度发现+MS08-067

信息收集 IP AddressOpening Ports10.10.10.4TCP:135,139,445 $ nmap -p- 10.10.10.4 --min-rate 1000 -sC -sV -Pn PORT STATE SERVICE VERSION 135/tcp open msrpc Microsoft Windows RPC 139/tcp open netbios-ssn Microsoft Windows n…

Docker私人学习笔记

俗话说“好记性不如烂笔头”,编程的海洋如此的浩大,养成做笔记的习惯是成功的一步! 此笔记主要是antlr4.13版本的笔记,并且笔记都是博主自己一字一字编写和记录,有错误的地方欢迎大家指正。 一、基础概念:…

Tomcat 服务器详解与优化实践

文章目录 Tomcat 服务器详解与优化实践一、Tomcat 简介1.1 什么是 Tomcat1.2 Tomcat 的核心组件1.3 什么是 Servlet 和 JSP 二、Tomcat 的核心组件结构2.1 Connector2.2 Container2.3 Tomcat 请求处理过程 三、Tomcat 服务部署3.1 安装准备3.2 安装 JDK3.3 安装和启动 Tomcat3.…

Java二十三种设计模式-责任链模式(17/23)

责任链模式:实现请求处理的灵活流转 引言 在这篇博客中,我们深入探讨了责任链模式的精髓,从其定义和用途到实现方法,再到使用场景、优缺点、与其他模式的比较,以及最佳实践和替代方案,旨在指导开发者如何…

SAP BW:QUERY数据结果写入ADSO

作者 idan lian 如需转载备注出处 如果对你有帮助,请点赞收藏~~~ 需求背景 客户基于QUERY进行报表展示,现需迁移到永洪报表平台,query中的变量参数,公式等无法直接生成视图,query相对复杂,不想直接在视图…

笔记mybatisplus

MP入门 Mybatis-Plus(简称MP)是一个Mybatis的增强工具,在Mybatis的基础上只做增强不做改变,为简化开发、提高效率而生。 Mybatis-Plus已经封装好了大量增删改查的方法,程序员只需要继承BaseMapper就可以使用这些方法…

大模型从入门到实战——RAG理解

大模型从入门到实战之RAG 1. 什么是 RAG 检索增强生成(RAG, Retrieval-Augmented Generation) 是一种创新的模型架构,旨在提升大型语言模型(LLM)的性能和输出质量。尽管 LLM 在许多自然语言处理任务中表现出色&#…

Linux阿里云服务器,利用docker安装EMQX

第一步,给云服务器docker进行加速 阿里云搜索“镜像加速器”,找到下面这个菜单,点进去 然后找到镜像工具下的镜像加速器 把这个加速器地址复制 然后在自己的云服务器中,找到docker的文件夹 点击json配置文件 把地址修改为刚刚…

如何将LaTeX数学公式嵌入到PowerPoint中

如何将LaTeX数学公式嵌入到PowerPoint中 简介 在学术演示或技术报告中,清晰且专业地展示数学公式是至关重要的。PowerPoint虽然提供了一些基本的公式编辑功能,但如果你需要更复杂或格式严格的公式,使用LaTeX生成公式并嵌入到PPT中是一个极佳…

Python酷库之旅-第三方库Pandas(092)

目录 一、用法精讲 391、pandas.Series.hist方法 391-1、语法 391-2、参数 391-3、功能 391-4、返回值 391-5、说明 391-6、用法 391-6-1、数据准备 391-6-2、代码示例 391-6-3、结果输出 392、pandas.Series.to_pickle方法 392-1、语法 392-2、参数 392-3、功能…

KT来袭,打造沉浸式体验的聚合性web3应用平台

随着步入 2024,漫长的区块链熊市即将接近尾声。纵观产业发展,逆流而上往往会是彰显品牌市场影响力和技术实力的最佳证明。在这次周期中,一个名为KT的web3.0聚合平台吸引了市场关注,无论在市场层面还是技术层面,都广泛赢…

听劝❗用AI做职场思维导图仅仅需要几秒钟啊

本文由 ChatMoney团队出品 嘿,各位职场朋友们 是不是常常对着密密麻麻的笔记感到焦虑呢? 想整理却无从下手? 别怕,ChatmoneyAI知识库来拯救你的整理困难症啦! 咱们都知道,思维导图是职场中必备的神器 …

zoom 会议机器人web例子

一、需要创建zoom app,创建及配置参考:Zoom会议机器人转写例子-CSDN博客 这里直接使用zoom-recall的配置。 二、需要生成签名,参数为:zoom-recall中的Client ID和Client Secret 1、git clone https://github.com/zoom/meetings…

【PHP入门教程】PHPStudy环境搭建+composer创建项目

文章目录 PHP 的历史PHP 的用途PHP 的特点和优势PHP 环境搭建环境准备安装window 安装CentOS / Ubuntu / Debian 安装 第一个Hello World使用Apache服务运行命令行运行代码 Composer安装 Composer:安装途中报错解决:初始化项目创建文件最终文件目录Compo…

微服务:配置管理和配置热更新

参考:黑马程序员之微服务 💥 该系列属于【SpringBoot基础】专栏,如您需查看其他SpringBoot相关文章,请您点击左边的连接 目录 一、引言 二、配置共享 1. 添加共享配置到nacos (1)jdbc的共享配置 shared…

iOS开发进阶(二十三):iOS 常见面试题汇总

文章目录 1. 如何理解RunLoop2. 如何理解RunTime3. KVO与KVC有什么联系4. iOS的事件传递过程5. CALayer 与 UIView 的关系6. iOS中为什么代理需要用 weak 修饰7. Block 为什么要用 copy 修饰8. 什么是 Block9. iOS 是如何实现 APNs 的10. 谈谈对内存管理的理解11. 什么是内存池…

设计模式:Service Locator模式简介

Service Locator模式 Service Locator 模式 Service Locator模式是一种设计模式,属于构造型模式,主要用于解决对象之间的依赖关系管理。它通过提供一个集中式的服务注册和查找机制,使得对象可以在运行时动态地获取所需的服务实例 主要特点 …

设计模式之Decorator装饰者、Facade外观、Adapter适配器(Java)

装饰者模式 设计模式的基本原则,对内关闭修改。 Decorator Pattern,装饰者模式,也叫包装器模式(Wrapper Pattern):将一个对象包装起来,增加新的行为和责任。一定是从外部传入,并且可以没有顺序&#xff0…

WPF 中,ControlTemplate 和 DataTemplate 是两种不同类型的模板和区别

1. 用途与定义 ControlTemplate:用于定义控件的外观和视觉行为。每个WPF控件都有一个ControlTemplate,它定义了控件的视觉树结构,包括控件的布局、子元素、样式以及触发器等。通过自定义ControlTemplate,可以彻底改变控件的外观和…

删除二叉搜索树中的节点,力扣405题

// 首先要清楚的是deleteNode这个函数起到了什么作用,返回的是什么,心里面清楚这个才能写后续的递归函数。 // 本题中,deleteNode函数是接收一个根节点和一个值,删除这棵树中和该值相等的那个结点。返回删除后的树的根节点。…