基于 vLLM 搭建 DeepSeek-V2 Chat 服务

直奔主题。

安装vLLM

官方实现的代码还没有 merge 到 vLLM 主分支，所以直接 git clone DeepSeek 的分支。

git clone https://github.com/zwd003/vllm.git
cd vllm
pip install -e .

源码安装大概耗时 10 分钟。

OpenAI 接口规范启动

官方 Github 放的是单条推理代码，如果需要启动 api 服务，直接用 OpenAI 接口规范启动即可：

CUDA_VISIBLE_DEVICES=0,1,2,3,4,5,6,7 python -m vllm.entrypoints.openai.api_server --model {YOUR_PATH}/deepseek-ai/DeepSeek-V2-Chat --port 10000 --tensor-parallel-size 8 --gpu-memory-utilization 0.9 --max-model-len 8192 --trust-remote-code

首次启动大概耗时10分钟（8卡80G A100），后续启动差不多1分钟以内。
注：如果跑崩了出现OOM，启动时添加参数 --enforce-eager 即可解决。
在这里插入图片描述

接口测试

{"model": "{YOUR_PATH}/deepseek-ai/DeepSeek-V2-Chat","messages": [{"role": "user", "content": "你是谁"}],"temperature": 0.3,"stream": false
}

在这里插入图片描述

参考链接：
https://github.com/deepseek-ai/DeepSeek-V2

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/bicheng/14084.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

基于 vLLM 搭建 DeepSeek-V2 Chat 服务

安装vLLM

OpenAI 接口规范启动

接口测试

相关文章

useState和setState的用法和区别

物流单管理系统软件教程

通过短信群发平台拓客引流营销的效果好不好？

噪声条件分数网络——NCSN原理解析

cesium圆形扩散扫描效果封装

docker容器安装nexus3以及nexus3备份迁移仓库数据

怎么查看公网IP？

LabVIEW高温往复摩擦测试系统中PID控制

吉时利Keithley 2010数字万用表7.5 位

人工智能应用-实验6-卷积神经网络分类minst手写数据集

521源码-在线客服-CRMChat网页版客服系统 UNIAPP 全方位在线客服系统源码与管理体系平台

列表页9大样式，保准你看了就能掌握。

美国教育数据分析

SpringBoot——整合MyBatis

C语言 | Leetcode C语言题解之第98题验证二叉搜索树

一个超级简单的Python UI库：NiceGUI

Science Robotics 封面论文：一种使用半球形纳米线阵列实现机器人视觉的超宽视场针孔复眼

好的架构是进化来的，不是设计来的

Wav2Vec 2.0：语音表示自监督学习框架

文章解读与仿真程序复现思路——电力系统保护与控制EI\CSCD\北大核心《基于改进Q学习算法和组合模型的超短期电力负荷预测》