本地部署 mistralai/Mistral-Nemo-Instruct-2407

1. 创建虚拟环境
2. 安装 fschat
3. 安装 transformers
4. 安装 flash-attn
5. 安装 pytorch
6. 启动 controller
7. 启动 mistralai/Mistral-Nemo-Instruct-2407
8. 启动 api
9. 访问 mistralai/Mistral-Nemo-Instruct-2407

1. 创建虚拟环境

conda create -n fastchat python=3.10 -y
conda activate fastchat

2. 安装 fschat

git clone https://github.com/lm-sys/FastChat.git; cd FastChat
pip install --upgrade pip  # enable PEP 660 support
pip install -e .

3. 安装 transformers

# Until a new release has been made, you need to install transformers from source
pip install git+https://github.com/huggingface/transformers.git

4. 安装 flash-attn

pip install packaging
pip uninstall -y ninja && pip install ninja
pip install flash-attn --no-build-isolation

5. 安装 pytorch

pip install torch==2.3.1 torchvision==0.18.1 torchaudio==2.3.1 --index-url https://download.pytorch.org/whl/cu121

6. 启动 controller

python -m fastchat.serve.controller

7. 启动 mistralai/Mistral-Nemo-Instruct-2407

python -m fastchat.serve.model_worker --num-gpus 2 --model-names "mistral-7b,gpt-3.5-turbo,gpt-3.5-turbo-16k,gpt-4,text-davinci-003" --model-path mistralai/Mistral-Nemo-Instruct-2407 --controller http://localhost:21001 --port 31000 --worker-address http://localhost:31000 --max-gpu-memory 16Gib

8. 启动 api

python -m fastchat.serve.openai_api_server --host 0.0.0.0 --port 8000

9. 访问 mistralai/Mistral-Nemo-Instruct-2407

使用 chatbox 配置好访问信息，

在这里插入图片描述

问它一个问题，
在这里插入图片描述
完结！

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/web/47783.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

本地部署 mistralai/Mistral-Nemo-Instruct-2407

本地部署 mistralai/Mistral-Nemo-Instruct-2407

1. 创建虚拟环境

2. 安装 fschat

3. 安装 transformers

4. 安装 flash-attn

5. 安装 pytorch

6. 启动 controller

7. 启动 mistralai/Mistral-Nemo-Instruct-2407

8. 启动 api

9. 访问 mistralai/Mistral-Nemo-Instruct-2407

相关文章

240722视频识别红色物体

Github 2024-07-22开源项目日报Top10

【测开能力提升-fastapi框架】fastapi能力提升 - 中间件与CORS

llama_index中使用Ollama是出现timed out 问题

传神社区|数据集合集第7期|法律NLP数据集合集

uniapp使用WebSocket发消息缓慢问题

Sokit(TCP/UDP调试工具)

简析漏洞生命周期管理的价值与关键要求

C++中的左值（lvalue）和右值（rvalue），移动语义（move semantics）和完美转发（perfect forwarding）

HarmonyOS应用开发者高级认证，Next版本发布后最新题库 - 多选题序号3

全面解析：构建基于深度学习的安全帽检测系统（UI界面+YOLO代码+数据集）

Linux 驱动学习笔记

List类型实体属性XML和JSON情景下的序列号和反序列化

TCP并发服务器多线程

安装Ubuntu24.04服务器版本

2024视频改字祝福豪车装X系统源码uniapp前端源码

如何解决ChromeDriver 126找不到chromedriver.exe问题

简化AI模型：PyTorch量化技术在边缘计算中的应用

SpringBoot中如何使用RabbitMq

JCR一区级 | Matlab实现CPO-Transformer-LSTM多变量回归预测【2024新算法】