liunx服务器部署Llama2大模型

模型：Llama2-chat-13B-Chinese-50W
在这里插入图片描述

01 下载安装 Llama2 模型

Huggingface在国内是访问不了的，需要使用代理。在这里推荐使用 clash-for-liunx 配置代理。

安装 git-lfs，用于大文件下载

sudo apt-get install git-lfs
git lfs install

Huggingface 下载 Llama2 模型

git clone https://huggingface.co/RicardoLee/Llama2-chat-13B-Chinese-50W

这里会下载很久，耐心等待吧。另外，可能会有文件下载失败，需要自己手动下载：

wget --no-check-certificate https://huggingface.co/RicardoLee/Llama2-chat-13B-Chinese-50W/resolve/main/pytorch_model-00001-of-00003.bin
wget --no-check-certificate https://huggingface.co/RicardoLee/Llama2-chat-13B-Chinese-50W/resolve/main/pytorch_model-00002-of-00003.bin
wget --no-check-certificate https://huggingface.co/RicardoLee/Llama2-chat-13B-Chinese-50W/resolve/main/pytorch_model-00003-of-00003.bin

环境配置

安装依赖库：

python -m pip install torch==2.0.0
python -m pip install transformers==4.30.0
python -m pip install sentencepiece==0.1.97python -m pip install peft==0.10.0
python -m pip install gradio==3.50.0
python -m pip install bitsandbytes
python -m pip install accelerate
python -m pip install scipy

同时将把 gradio 里的gradio_demo.py下载到服务器

wget https://github.com/ymcui/Chinese-LLaMA-Alpaca/blob/main/scripts/inference/gradio_demo.py
mv gradio_demo.py ~/Workspace/Llama2/

部署

查看GPU状态

nvidia-smi

命令行启动

python gradio_demo.py --base_model Llama2-chat-13B-Chinese-50W --tokenizer_path Llama2-chat-13B-Chinese-50W --load_in_8bit --gpus 0

效果展示

在这里插入图片描述

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/web/7083.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

liunx服务器部署Llama2大模型

01 下载安装 Llama2 模型

环境配置

部署

效果展示

相关文章

java实现通用的文本相似度评估方法（余弦相似度计算）

数据分析必备：一步步教你如何用numpy改变数据处理（5）

Transformer 解析超级详细版

《21天学通C++》（第十四章）宏和模板介绍（1）

AI神助攻！小白也能制作自动重命名工具~

全国33个省228189个矿产地位置分布数据，含经纬度坐标/CSV格式

【华为】路由策略小实验

OSTEP Projects：Reverse

75.网络游戏逆向分析与漏洞攻防-角色与怪物信息的更新-伪造服务端更新属性消息欺骗客户端

wordpress外贸网站建设主机选择的注意事项

UE5（射线检测）学习笔记

语音识别简介

MySQL没有初始化配置文件设置属性

淘宝商品评论数据获取：从API调用到应用实践

Pycharm debug 运行报错（RuntimeError: cannot release un-acquired lock）

[激光原理与应用-92]：振镜的光路图原理

MQ如何保证可靠性

被苹果商店打回20多个包，App Store都干了啥！

Typescript语法二

头歌实验六 Java流式编程与网络程序设计