实践-并发调用qwen-openai格式http请求

1、用ms-swift启动模型

2、用python实现http调用

3、用并发实现同时调用

import requests
class Qwen:api_key = 'EMPTY'base_url = "http://127.0.0.1:8001/v1/chat/completions"name = 'qwen2_5-72b-instruct'class Llama:api_key = 'EMPTY'base_url = "http://127.0.0.1:8001/v1/chat/completions"name = 'llama3-70b-instruct'def chat_with_gpt(api_key, messages, model="gpt-3.5-turbo", temperature=0.3, stream=False, url="https://api.openai.com/v1/chat/completions"):"""与OpenAI ChatGPT API交互的函数。参数:api_key (str): OpenAI API密钥。messages (list): 消息列表,格式为 [{"role": "user", "content": "你的消息"}].model (str): 使用的模型,默认为 "gpt-3.5-turbo".temperature (float): 温度参数,控制生成文本的随机性,默认为 0.7.stream (bool): 是否启用流式输出,默认为 False.url (str): API端点,默认为 "https://api.openai.com/v1/chat/completions".返回:如果 stream=False,返回完整的响应内容。如果 stream=True,返回一个生成器,逐步生成响应片段。"""# 请求头headers = {"Content-Type": "application/json","Authorization": f"Bearer {api_key}"}import json# 请求体data = {"model": model,"messages": messages,"temperature": temperature,"stream": stream}print('header',json.dumps(headers,ensure_ascii=False))print('data',json.dumps(data,ensure_ascii=False))# 发送请求if stream:# 流式请求response = requests.post(url, headers=headers, json=data, stream=True)return _handle_stream_response(response)else:# 非流式请求response = requests.post(url, headers=headers, json=data)return response.json()def _handle_stream_response(response):"""处理流式响应的生成器函数。参数:response: requests.Response 对象。返回:生成器,逐步生成响应片段。"""for chunk in response.iter_lines():if chunk:decoded_chunk = chunk.decode("utf-8")yield decoded_chunk
message = [{"role": "user", "content": "你是谁"}]
import time
# t1  = time.time()
# r1 = chat_with_gpt(Qwen.api_key, message, model=Qwen.name,url=Qwen.base_url)
# t2 = time.time()
# print(t2-t1)
#
# t1  = time.time()
# r2 = chat_with_gpt(Llama.api_key, message, model=Llama.name,url=Llama.base_url)
# t2 = time.time()
# print(t2-t1)
# print(r2)
#print(r2)def chat_with_model(model_class, message):"""并发请求的辅助函数,用于与特定模型交互。参数:model_class: 模型类(如 Qwen 或 Llama)。message (list): 消息列表,格式为 [{"role": "user", "content": "你的消息"}].返回:模型的响应内容。"""t1 = time.time()response = chat_with_gpt(model_class.api_key, message, model=model_class.name, url=model_class.base_url)t2 = time.time()print(f"Time taken for {model_class.name}: {t2 - t1} seconds")return response,round(t2-t1,4)import concurrent.futures
# 定义不同的消息
messages = [[{"role": "user", "content": "你是谁"}],[{"role": "user", "content": "你是谁"}],[{"role": "user", "content": "你是谁"}],[{"role": "user", "content": "你是谁"}],[{"role": "user", "content": "你是谁"}],[{"role": "user", "content": "你是谁"}],[{"role": "user", "content": "你是谁"}],[{"role": "user", "content": "你是谁"}],[{"role": "user", "content": "你是谁"}],[{"role": "user", "content": "你是谁"}],]# 定义模型列表
models = [ Llama]
durations = []
# 并发请求多个模型和不同的消息
with concurrent.futures.ThreadPoolExecutor() as executor:# 提交任务,每个任务使用不同的模型和消息futures = {executor.submit(chat_with_model, model, message): (model, message)for model in modelsfor message in messages}# 获取结果for future in concurrent.futures.as_completed(futures):model, message = futures[future]try:response,duration = future.result()durations.append(duration)print(f"Response from {model.name} with message {message}: {response}")except Exception as e:print(f"Error occurred with {model.name} and message {message}: {e}")
# llama
#[1.487, 5.2435, 6.6109, 7.9721, 9.3312, 10.737, 15.1935, 16.5562, 17.9155, 19.2751]# qwen
#[8.5853, 18.9962, 29.1533, 37.4593, 45.8992, 54.3415, 62.7779, 72.2762, 82.2203, 92.1694]print(durations)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/67739.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

微信小程序-base64加解密

思路:先创建一个base64.js的文件,这个文件可以作为专门加解密的文件模块,需要时就引用;创建好后,引用base64.js里的加解密函数。 注意:引用模块一定要引用正确的路径,否则会报错。 base64.js:…

C++《AVL树》

在之前的学习当中我们已经了解了二叉搜索树,并且我们知道二叉搜索树的查找效率是无法满足我们的要求,当二叉树为左或者右斜树查找的效率就很低下了,那么这本篇当中我们就要来学习对二叉搜索树进行优化的二叉树——AVL树。在此会先来了解AVL树…

四、华为交换机 STP

生成树协议(STP)的核心目的是在存在冗余链路的网络中,构建一个无环的拓扑结构,从而防止网络环路带来的广播风暴等问题 一、STP 原理 选举根桥:网络中的每台交换机都会有一个唯一的桥 ID(BID)&am…

Elasticsearch——Elasticsearch索引管理实战

摘要 本文主要介绍了 Elasticsearch 中索引与索引模板的实战操作。首先讲解了索引管理,包括禁止自动创建索引、索引的格式、创建索引示例、修改索引示例、打开/关闭索引示例、删除索引、查看索引以及 Kibana 管理索引等内容。接着阐述了索引模板管理,涉…

Linux C\C++编程-文件位置指针与读写文件数据块

【图书推荐】《Linux C与C一线开发实践(第2版)》_linux c与c一线开发实践pdf-CSDN博客 《Linux C与C一线开发实践(第2版)(Linux技术丛书)》(朱文伟,李建英)【摘要 书评 试读】- 京东图书 Linu…

4.JoranConfigurator解析logbak.xml

文章目录 一、前言二、源码解析GenericXMLConfiguratorlogback.xml解析通过SaxEvent构建节点model解析model节点DefaultProcessor解析model 三、总结 一、前言 上一篇介绍了logback模块解析logback.mxl文件的入口, 我们可以手动指定logback.xml文件的位置, 也可以使用其它的名…

leetcode刷题记录(七十八)——105. 从前序与中序遍历序列构造二叉树

(一)问题描述 105. 从前序与中序遍历序列构造二叉树 - 力扣(LeetCode)105. 从前序与中序遍历序列构造二叉树 - 给定两个整数数组 preorder 和 inorder ,其中 preorder 是二叉树的先序遍历, inorder 是同一…

包文件分析器 Webpack Bundle Analyzer

webpack-bundle-analyzer 是一个非常有用的工具,用于可视化和分析 Webpack 打包生成的文件。这使得开发者能够更好地理解应用的依赖关系、包的大小,以及优化打包的机会。以下是关于 webpack-bundle-analyzer 的详细介绍,包括它的安装、使用以…

【PowerQuery专栏】PowerQuery提取XML数据

XML数据和Json 数据类型都是比较典型的层次数据类型,XML的数据格式非常的对称。所有的数据均是由标签对组成,图为典型的XML文件类型的数据。 在PowerQuery中进行XML数据类型解析采用的是Xml.Document 函数来进行文件内容的解析,Xml.Document 目前有三个可用参数。 参数1为数…

1.21学习记录

misc 2023isctf 你说爱我尊嘟假嘟 这题有点脑洞,需要把你说爱我换成Ook.将尊嘟换为Ook!假嘟换成Ook?(根据语气进行猜测吧)用在线工具解密最后用base64解密即可 2023isctf 杰伦可是流量明星 解压后是一个MP3文件&am…

如何将自己本地项目开源到github上?

环境: LLMB项目 问题描述: 如何将自己本地项目开源到github上? 解决方案: 步骤 1: 准备本地项目 确保项目整洁 确认所有的文件都在合适的位置,并且项目的 README.md 文件已经完善。检查是否有敏感信息&#xff0…

【MySQL】数据库基础知识

欢迎拜访:雾里看山-CSDN博客 本篇主题:【MySQL】数据库基础知识 发布时间:2025.1.21 隶属专栏:MySQL 目录 什么是数据库为什么要有数据库数据库的概念 主流数据库mysql的安装mysql登录使用一下mysql显示数据库内容创建一个数据库创…

使用插件SlideVerify实现滑块验证

作者gitee地址:https://gitee.com/monoplasty/vue-monoplasty-slide-verify 使用步骤: 1、安装插件 npm install --save vue-monoplasty-slide-verify 2、在main.js中进行配置 import SlideVerify from vue-monoplasty-slide-verify; Vue.use(SlideV…

Windows配置frp内网穿透实现远程连接

仅个人记录 本文仅介绍客户端的配置 1. 开始 frp分为服务端和客户端,为实现内网穿透需要同时配置服务端和客户端,并且版本保持一致,可以前往 frp github下载 本文使用 0.51.2 版本,从GitHub下载并解压,得到如下文件…

“大模型横扫千军”背后的大数据挖掘--浅谈MapReduce

文章目录 O 背景知识1 数据挖掘2 邦费罗尼原则3 TF.IDF4 哈希函数5 分布式文件系统 一、MapReduce基本介绍1. Map 任务2. 按键分组3. Reduce 任务4. 节点失效处理5.小测验:在一个大型语料库上有100个map任务和若干reduce任务: 二、基于MapReduce的基本运…

第17个项目:Python烟花秀

源码下载地址:https://download.csdn.net/download/mosquito_lover1/90295693 核心源码: import pygame import random import math from PIL import Image import io # 初始化pygame pygame.init() # 设置窗口 WIDTH = 800 HEIGHT = 600 screen = pygame.display.s…

JavaScript学习笔记(1)

html 完成了架子, css 做了美化,但是网页是死的,我们需要给他注入灵魂,所以接下来我们需要学习 JavaScript,这门语言会让我们的页面能够和用户进行交互。 一、引入方式 1.内部脚本 将 JS 代码定义在 HTML 页面中 Jav…

二十七、资源限制-LimitRange

LimitRange生产必备 在调度的时候 requests 比较重要,在运行时 limits 比较重要。 一、产生原因 生产中只有ResourceQuota是不够的 只配置ResourceQuotas的情况下,pod的yaml文件没有配置resources配置,都是0的话,就可以无限配置,永远达不到limit LimitRange做了什么 如…

docker部署的gitlab迁移

docker部署的gitlab迁移_docker gitlab 迁移-CSDN博客 gitlab-rake gitlab:backup:restore BACKUP 后面一路yes 生活中总是充满了各种选择,点餐纠结,出行选择,聚餐座位,团队投票结果不明,随机抽签一锤定音等等&#xf…

GS论文阅读--GeoTexDensifier

前言 本文是一个关于高斯致密化策略对高斯地图进行优化,他主要关注了几何结构和纹理信息。我最近对于高斯点的分布比较感兴趣,因为高斯点的分布决定了之后重建质量的好坏,初始化高斯很重要,但之后的维护需要致密化与修建策略&…