书生·浦语训练营二期第二次笔记

文章目录

  • 1. 部署 InternLM2-Chat-1.8B 模型进行智能对话
    • 1.1 配置环境
    • 1.2 下载 InternLM2-Chat-1.8B 模型
  • 2. 实战:部署实战营优秀作品 八戒-Chat-1.8B 模型
    • 2.1 配置基础环境
    • 2.2 使用 git 命令来获得仓库内的 Demo 文件:
    • 2.3 下载运行 Chat-八戒 Demo
  • 3. 使用 Lagent 运行 InternLM2-Chat-7B 模型
  • 4. 使用 Lagent 运行 InternLM2-Chat-7B 模型为内核的智能体
  • 5. 实践部署 浦语·灵笔2 模型
    • 5.1 配置基础环境
    • 5.2 图文写作实战
    • 5.3 图片理解实战

  • 教程文档:https://github.com/InternLM/Tutorial/blob/camp2/helloworld/hello_world.md
  • 智能体lagent repo: https://github.com/InternLM/lagent
    多模态大模型InternLM-XComposerhttps://github.com/InternLM/InternLM-XComposer/tree/main
  • 轻松玩转书生·浦语大模型趣味 Demo

1. 部署 InternLM2-Chat-1.8B 模型进行智能对话

1.1 配置环境

  1. 创建conda环境,安装必要的库
studio-conda -o internlm-base -t demo
# 与 studio-conda 等效的配置方案
# conda create -n demo python==3.10 -y
# conda activate demo
# conda install pytorch==2.0.1 torchvision==0.15.2 torchaudio==2.0.2 pytorch-cuda=11.7 -c pytorch -c nvidia

在这里插入图片描述

  1. 配置完成后,进入到新创建的 conda 环境之中:
conda activate demo

在这里插入图片描述

  1. 输入以下命令,完成环境包的安装:
pip install huggingface-hub==0.17.3
pip install transformers==4.34 
pip install psutil==5.9.8
pip install accelerate==0.24.1
pip install streamlit==1.32.2 
pip install matplotlib==3.8.3 
pip install modelscope==1.9.5
pip install sentencepiece==0.1.99

在这里插入图片描述
查看该环境内已安装的包

conda list

1.2 下载 InternLM2-Chat-1.8B 模型

  1. 按路径创建文件夹,并进入到对应文件目录中:
mkdir -p /root/demo
touch /root/demo/cli_demo.py
touch /root/demo/download_mini.py
cd /root/demo

这里的touch命令用于创建两个空的Python文件:cli_demo.pydownload_mini.py。如果这些文件已经存在,touch命令不会更改它们的内容,只会更新时间戳。

touch命令通常用于:

  1. 创建空文件
  2. 更新文件的时间戳(访问时间和修改时间)
  3. 避免在脚本或Makefile中创建文件时出现"文件不存在"的错误
    通过左侧文件夹栏目,双击进入demo文件夹。
  1. 双击打开 /root/demo/download_mini.py 文件,复制以下代码:
import os
from modelscope.hub.snapshot_download import snapshot_download# 创建保存模型目录
os.system("mkdir /root/models")# save_dir是模型保存到本地的目录
save_dir="/root/models"snapshot_download("Shanghai_AI_Laboratory/internlm2-chat-1_8b", cache_dir=save_dir, revision='v1.1.0')

在这里插入图片描述
3. 执行命令,下载模型参数文件:

python /root/demo/download_mini.py

在这里插入图片描述
4. 运行 cli_demo
双击打开 /root/demo/cli_demo.py 文件,复制以下代码:

import torch
from transformers import AutoTokenizer, AutoModelForCausalLMmodel_name_or_path = "/root/models/Shanghai_AI_Laboratory/internlm2-chat-1_8b"tokenizer = AutoTokenizer.from_pretrained(model_name_or_path, trust_remote_code=True, device_map='cuda:0')
model = AutoModelForCausalLM.from_pretrained(model_name_or_path, trust_remote_code=True, torch_dtype=torch.bfloat16, device_map='cuda:0')
model = model.eval()system_prompt = """You are an AI assistant whose name is InternLM (书生·浦语).
- InternLM (书生·浦语) is a conversational language model that is developed by Shanghai AI Laboratory (上海人工智能实验室). It is designed to be helpful, honest, and harmless.
- InternLM (书生·浦语) can understand and communicate fluently in the language chosen by the user such as English and 中文.
"""messages = [(system_prompt, '')]print("=============Welcome to InternLM chatbot, type 'exit' to exit.=============")while True:input_text = input("\nUser  >>> ")input_text = input_text.replace(' ', '')if input_text == "exit":breaklength = 0for response, _ in model.stream_chat(tokenizer, input_text, messages):if response is not None:print(response[length:], flush=True, end="")length = len(response)

使用 Hugging Face Transformers 库与 InternLM 对话模型进行交互的 Python代码。

  1. 加载分词器和模型:

    • tokenizer = AutoTokenizer.from_pretrained(...): 加载与模型相对应的分词器。
    • model = AutoModelForCausalLM.from_pretrained(...): 加载语言模型,使用 bfloat16 数据类型,并指定设备为 cuda:0
    • model = model.eval(): 将模型设置为评估模式。
  2. 定义系统提示:

    • system_prompt = """...""": 定义一个系统提示,介绍 InternLM 助手的基本信息。
  3. 初始化消息列表:

    • messages = [(system_prompt, '')]: 将系统提示添加到消息列表中。
  4. 开始交互循环:

    • while True: 进入无限循环,直到用户输入 “exit” 时退出。
    • input_text = input("\nUser >>> "): 提示用户输入问题。
    • input_text = input_text.replace(' ', ''): 去除输入文本中的空格。
  5. 生成助手的响应:

    • for response, _ in model.stream_chat(tokenizer, input_text, messages): 使用 stream_chat 方法生成助手的响应。
      • tokenizer: 分词器对象。
      • input_text: 用户输入的问题。
      • messages: 之前的对话消息列表。
    • 循环内部:
      • 如果 response 不为 None,则打印从上次打印的长度到当前长度的新生成内容。
      • 更新 length 变量为当前响应的长度。

在命令行运行
python /root/demo/cli_demo.py

在这里插入图片描述

2. 实战:部署实战营优秀作品 八戒-Chat-1.8B 模型

2.1 配置基础环境

运行环境命令:

conda activate demo

2.2 使用 git 命令来获得仓库内的 Demo 文件:

cd /root/
git clone https://gitee.com/InternLM/Tutorial -b camp2
# git clone https://github.com/InternLM/Tutorial -b camp2
cd /root/Tutorial

在这里插入图片描述

2.3 下载运行 Chat-八戒 Demo

在 Web IDE 中执行 bajie_download.py:

python /root/Tutorial/helloworld/bajie_download.py

可以看到这部分代码的作用是下载模型权重
在这里插入图片描述
在这里插入图片描述
待程序下载完成后,输入运行命令:

streamlit run /root/Tutorial/helloworld/bajie_chat.py --server.address 127.0.0.1 --server.port 6006
  • 这条命令的意思是:使用Streamlit运行位于/root/Tutorial/helloworld/bajie_chat.py的Python脚本作为web应用,并且仅允许从运行该命令的本地机器访问此应用,通过端口号6006进行访问。

在这里插入图片描述
查询开发机端口是40637
在这里插入图片描述

# 从本地使用 ssh 连接 studio 端口
# 将下方端口号 38374 替换成自己的端口号
ssh -CNg -L 6006:127.0.0.1:6006 root@ssh.intern-ai.org.cn -p 40637

命令ssh -CNg -L 6006:127.0.0.1:6006 root@ssh.intern-ai.org.cn -p 38374是使用SSH协议创建一个安全的隧道,用于将本地计算机的端口转发到远程服务器或从远程服务器转发到本地。这里的命令可以分解为几个部分,每个部分的作用如下:

  • ssh:这是Secure Shell(SSH)的命令行接口,用于安全地访问远程服务器。
  • -C:这个选项会启用压缩,可以加快传输速度。
  • -Ng-N 表示不执行远程命令,只进行端口转发;-g 允许远程主机连接到本地转发的端口,通常出于安全考虑不推荐开启。
  • -L 6006:127.0.0.1:6006:这是本地端口转发的参数。-L 表示本地端口转发,格式为本地端口:远程地址:远程端口。这里将本地的6006端口转发到远程主机(ssh.intern-ai.org.cn)上的127.0.0.1地址的6006端口。简单来说,通过本地6006端口访问的所有数据都会发送到远程服务器的6006端口。
  • root@ssh.intern-ai.org.cn:这部分指定了要连接的远程服务器和用户。这里使用root用户连接到ssh.intern-ai.org.cn
  • -p 38374:指定连接远程服务器时使用的端口号。这里是38374

总之,这条命令的作用是:在不执行任何远程命令的情况下,将本地机器的6006端口转发到远程服务器ssh.intern-ai.org.cn6006端口,通过38374端口建立安全的SSH连接。这样,本地机器上运行的应用(比如Streamlit应用)就可以通过远程服务器访问,实现了一种安全的端口转发。

在这里插入图片描述

  • 我为什么运行了这行命令后ssh -CNg -L 6006:127.0.0.1:6006 root@ssh.intern-ai.org.cn -p 40637
    等了很久命令行都没反应?
    答:
    命令行没有反应是预期行为,这意味着SSH隧道已经成功建立并在后台运行。这条命令的作用是创建一个SSH隧道,通过端口转发将本地的6006端口映射到远程服务器上的6006端口,且该命令是在后台执行的。

  • 因为使用了-N选项,所以SSH客户端不会打开一个远程shell,命令执行后不会有任何输出表明命令正在执行。它只是静静地在后台运行,等待通过端口转发的数据。这正是你所观察到的“没有反应”的原因。

使用隧道访问(通过浏览器访问http://127.0.0.1:6006)看是否能够成功连接到通过隧道映射的服务。

在这里插入图片描述

3. 使用 Lagent 运行 InternLM2-Chat-7B 模型

输入命令,开启 conda 环境:

conda activate demo

打开文件子路径

cd /root/demo

使用 git 命令下载 Lagent 相关的代码库:

git clone https://gitee.com/internlm/lagent.git
# git clone https://github.com/internlm/lagent.git
cd /root/demo/lagent
git checkout 581d9fb8987a5d9b72bb9ebd37a95efd47d479ac
pip install -e . # 源码安装

运行效果如图:
在这里插入图片描述

4. 使用 Lagent 运行 InternLM2-Chat-7B 模型为内核的智能体

  1. 打开 lagent 路径:
cd /root/demo/lagent

在 terminal 中输入指令,构造软链接快捷访问方式:

ln -s /root/share/new_models/Shanghai_AI_Laboratory/internlm2-chat-7b /root/models/internlm2-chat-7b

使用了ln命令的-s选项来创建一个符号链接(类似于Windows中的快捷方式)。它会在/root/models/internlm2-chat-7b位置创建一个指向/root/share/new_models/Shanghai_AI_Laboratory/internlm2-chat-7b的符号链接。这意味着,当访问/root/models/internlm2-chat-7b时,实际上会被重定向到/root/share/new_models/Shanghai_AI_Laboratory/internlm2-chat-7b

打开 lagent 路径下 examples/internlm2_agent_web_demo_hf.py 文件,并修改对应位置 (71行左右) 代码:

# 其他代码...
value='/root/models/internlm2-chat-7b'
# 其他代码...

输入运行命令 - 点开 6006 链接后,大约需要 5 分钟完成模型加载:

streamlit run /root/demo/lagent/examples/internlm2_agent_web_demo_hf.py --server.address 127.0.0.1 --server.port 6006

mac在命令行输入

# 从本地使用 ssh 连接 studio 端口
# 将下方端口号 38374 替换成自己的端口号
ssh -CNg -L 6006:127.0.0.1:6006 root@ssh.intern-ai.org.cn -p 40637

访问127.0.0.1等待加载模型:
在这里插入图片描述
表现还不错哦。
在这里插入图片描述

5. 实践部署 浦语·灵笔2 模型

5.1 配置基础环境

选用 50% A100 进行开发:
进入开发机,启动 conda 环境:

conda activate demo
# 补充环境包
pip install timm==0.4.12 sentencepiece==0.1.99 markdown2==2.4.10 xlsxwriter==3.1.2 gradio==4.13.0 modelscope==1.9.5

下载 InternLM-XComposer 仓库 相关的代码资源:

cd /root/demo
git clone https://gitee.com/internlm/InternLM-XComposer.git
# git clone https://github.com/internlm/InternLM-XComposer.git
cd /root/demo/InternLM-XComposer
git checkout f31220eddca2cf6246ee2ddf8e375a40457ff626

在这里插入图片描述

在 terminal 中输入指令,构造软链接快捷访问方式:

ln -s /root/share/new_models/Shanghai_AI_Laboratory/internlm-xcomposer2-7b /root/models/internlm-xcomposer2-7b
ln -s /root/share/new_models/Shanghai_AI_Laboratory/internlm-xcomposer2-vl-7b /root/models/internlm-xcomposer2-vl-7b

5.2 图文写作实战

继续输入指令,用于启动 InternLM-XComposer:

cd /root/demo/InternLM-XComposer
python /root/demo/InternLM-XComposer/examples/gradio_demo_composition.py  \
--code_path /root/models/internlm-xcomposer2-7b \
--private \
--num_gpus 1 \
--port 6006

mac打开端口映射:

# 从本地使用 ssh 连接 studio 端口
# 将下方端口号 38374 替换成自己的端口号
ssh -CNg -L 6006:127.0.0.1:6006 root@ssh.intern-ai.org.cn -p 38374

在这里插入图片描述
显存占用记录:
在这里插入图片描述
控制台输出记录:
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
先生成文章,再插入和下载图片。
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

插入的图片是从互联网中下载的。见上一期测试记录:https://blog.csdn.net/qq_37397652/article/details/135540633

5.3 图片理解实战

关闭并重新启动一个新的 terminal,继续输入指令,启动 InternLM-XComposer2-vl:

conda activate democd /root/demo/InternLM-XComposer
python /root/demo/InternLM-XComposer/examples/gradio_demo_chat.py  \
--code_path /root/models/internlm-xcomposer2-vl-7b \
--private \
--num_gpus 1 \
--port 6006

打开 http://127.0.0.1:6006 (上传图片后) 键入内容示例如下:

  1. 图片内容理解的非常好,虽然交规知识的答案解答错了。
    在这里插入图片描述
    在这里插入图片描述
  2. 图片理解的很好,有上下文记忆,答案也接近正确答案。
    在这里插入图片描述
    在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/793105.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

19.网络测试

考试频率低;主要是上午题; 主要议题: 1.网络全生命周期测试策略 2.网络设备评测指标 吞吐量:单位时间内完成xxxx的数量;如:不丢包情况下,系统最大的包转发速度; 丢包率&#xff…

哈佛大学商业评论 -- 第二篇:增强现实是如何工作的?

AR将全面融入公司发展战略! AR将成为人类和机器之间的新接口! AR将成为人类的关键技术之一! 请将此文转发给您的老板! --- 本文作者:Michael E.Porter和James E.Heppelmann 虽然物理世界是三维的,但大…

C语言进阶课程学习记录-第22课 - 条件编译使用分析

C语言进阶课程学习记录-第22课 - 条件编译使用分析 条件编译基本概念条件编译实验条件编译本质实验-ifdefinclude本质实验-间接包含同一个头文件解决重复包含的方法-ifndef实验-条件编译的应用小结 本文学习自狄泰软件学院 唐佐林老师的 C语言进阶课程,图片全部来源…

Java spring 01 (图灵)

01.依赖注入 这里两个方法用到了datasource方法,不是bean这样的使用,没有autowird 会创建两个datasource configuration 会运行代理模式 会产生一个AppConfig的代理对象 这个代理对象会在spring的容器先找bean,datasource此时已经创建了be…

Linux-进程概念

1. 进程基本概念 书面概念:程序的一个执行实例,正在执行的程序等 内核概念:担当分配系统资源(CPU时间,内存)的实体。 2. 描述和组织进程-PCB PCB(process contral block)&#xff0…

RisingWave 在品高股份 Bingo IAM 中的应用

背景介绍 公司背景 品高股份,是国内专业的云计算及行业信息化服务提供商。公司成立于 2003 年,总部位于广州,下设多家子公司和分公司,目前员工总数近 900 人,其中 80 %以上是专业技术人员。 品高股份在 2008 年便开…

Linux集群部署项目

目录 一,环境准备 1.1.安装MySQL 1.2.安装JDK 1.3.安装TomCat 1.4.安装Nginx 二,部署 2.1.后台服务部署 2.2.Nginx配置负载均衡及静态资源部署 一,环境准备 1.1.安装MySQL 将MySQL的安装包上传至服务器 查看系统中是否存在mariadb&…

Go 源码之互斥锁 Mutex

文章目录 一、总结二、源码(一)Mutex(二) Lock(三)Unlock 三、常见问题有劳各位看官 点赞、关注➕收藏 ,你们的支持是我最大的动力!!!接下来会不断更新 golan…

中间件漏洞!!!

上次好像记得讲过了框架漏洞,(weblogic不是)那么,今天我们就来讲一些中间件的漏洞 1.Apache解析漏洞 众所周知,Apache是一个非常出名的中间件,本来呢,他是不存在漏洞的,但是如果用…

探索大数据时代下与云计算技术融合:实现企业级数据处理与分析的灵活性和效率性

引言: 关联阅读博客文章:深度剖析:计算机集群在大数据体系中的关键角色和技术要点 随着信息时代的到来,数据量的爆炸性增长已成为一种常态。企业、政府、科研机构等各个领域都面临着海量数据的收集、存储、处理和分析的挑战。在…

Flutter-发布插件到pub上传不上问题

问题1: 尝试指令: flutter packages pub publish --serverhttps://pub.dartlang.org问题2: 问题1解决后,进入验证身份,点击终端显示的链接,跳转到google验证,记得这里要科*学上网,点…

基于 Docker 的 python grpc quickstart

工作之后一直使用的 RPC 框架是 Apache 的 thrift,现在发现 grpc 更流行,所以也要学习一下,先来简单的跑一下 demo。在本地安装运行也很方便,不过因为有了 docker,所以在 docker 里面安装运行隔离性更好,顺…

Unity框架,ET框架8.1版本的打包流程记录

目录 打包代码前置1.必须要安装Visusal Studio 2022的组件,如下图,必须都要进行安装,不然会在代码重构的时候报错,丢失SDK。Rider的版本必须2023及以上 步骤一、使用Rider编辑器打开项目后进行重构项目步骤二、使用HybirdCLR生成A…

在ArcGIS Pro中优雅的制作荧光图

最近在网上看到了荧光图,觉得挺帅气,去网上查询了怎么制作荧光图,发现大部分都是QGIS的教程,作为ArcGIS的死忠用户,决定在ArcGIS Pro中实现,其实挺简单的。 1、软件:ArcGIS Pro3.0 2、点数据&a…

NOI - OpenJudge - 2.5基本算法之搜索 - 1490:A Knight‘s Journey - 超详解析(含AC代码)

点赞关注吧~ 1490:A Knights Journey 查看提交统计提问 总时间限制: 1000ms 内存限制: 65536kB 描述 Background The knight is getting bored of seeing the same black and white squares again and again and has decided to make a journey around the world. When…

前端三剑客 —— CSS (第五节)

目录 内容回顾: 特殊样式 特殊样式 CSS变量 常见函数 倒影效果 页面布局 Table 布局(了解即可) DIVCSS布局 弹性布局 1)不使用弹性布局,而是使用DIVCSS 2)使用弹性布局实现导航菜单 内容回顾…

echart 仪表盘实现指针的渐变色及添加图片

需求: 在仪表盘中设置指针为渐变色,并在仪表盘中间添加图片。 实现重点: 1、仪表盘指针渐变色的实现 渐变色通过设置pointer的itemStyle属性内的color实现,重点是echart版本,这个原本使用4.8.0的版本不起作用&#xff…

AD20全流程的使用笔记

目录 首先一个完整的AD工程文件需要我们自己建立的文件有这些: 新建工程: 从现有的工程文件中将元件添加到原理图库: 元件的摆放: 器件的复制及对齐: 导线、Netlabe、端口的添加: Value值的校对&…

SQL注入---盲注

文章目录 前言一、pandas是什么?二、使用步骤 1.引入库2.读入数据总结 一.盲注概述 注是一种SQL注入攻击的形式,在这种攻击中,攻击者向目标应用程序发送恶意注入代码,然后通过观察应用程序的响应来推断出数据库中的信息。与常规的…

设计模式——抽象工厂模式02

如果是工厂模式是对同一类商品进行抽象然后生产。 那么抽象工厂模式是对工厂的抽象,每个工厂都能生产多种产品,不同工厂生产的商品性质相同,但外观,品牌会略有差异。 设计模式,一定要敲代码理解 商品抽象 public in…