实践-并发调用qwen-openai格式http请求

1、用ms-swift启动模型

2、用python实现http调用

3、用并发实现同时调用

import requests
class Qwen:api_key = 'EMPTY'base_url = "http://127.0.0.1:8001/v1/chat/completions"name = 'qwen2_5-72b-instruct'class Llama:api_key = 'EMPTY'base_url = "http://127.0.0.1:8001/v1/chat/completions"name = 'llama3-70b-instruct'def chat_with_gpt(api_key, messages, model="gpt-3.5-turbo", temperature=0.3, stream=False, url="https://api.openai.com/v1/chat/completions"):"""与OpenAI ChatGPT API交互的函数。参数:api_key (str): OpenAI API密钥。messages (list): 消息列表,格式为 [{"role": "user", "content": "你的消息"}].model (str): 使用的模型,默认为 "gpt-3.5-turbo".temperature (float): 温度参数,控制生成文本的随机性,默认为 0.7.stream (bool): 是否启用流式输出,默认为 False.url (str): API端点,默认为 "https://api.openai.com/v1/chat/completions".返回:如果 stream=False,返回完整的响应内容。如果 stream=True,返回一个生成器,逐步生成响应片段。"""# 请求头headers = {"Content-Type": "application/json","Authorization": f"Bearer {api_key}"}import json# 请求体data = {"model": model,"messages": messages,"temperature": temperature,"stream": stream}print('header',json.dumps(headers,ensure_ascii=False))print('data',json.dumps(data,ensure_ascii=False))# 发送请求if stream:# 流式请求response = requests.post(url, headers=headers, json=data, stream=True)return _handle_stream_response(response)else:# 非流式请求response = requests.post(url, headers=headers, json=data)return response.json()def _handle_stream_response(response):"""处理流式响应的生成器函数。参数:response: requests.Response 对象。返回:生成器,逐步生成响应片段。"""for chunk in response.iter_lines():if chunk:decoded_chunk = chunk.decode("utf-8")yield decoded_chunk
message = [{"role": "user", "content": "你是谁"}]
import time
# t1  = time.time()
# r1 = chat_with_gpt(Qwen.api_key, message, model=Qwen.name,url=Qwen.base_url)
# t2 = time.time()
# print(t2-t1)
#
# t1  = time.time()
# r2 = chat_with_gpt(Llama.api_key, message, model=Llama.name,url=Llama.base_url)
# t2 = time.time()
# print(t2-t1)
# print(r2)
#print(r2)def chat_with_model(model_class, message):"""并发请求的辅助函数,用于与特定模型交互。参数:model_class: 模型类(如 Qwen 或 Llama)。message (list): 消息列表,格式为 [{"role": "user", "content": "你的消息"}].返回:模型的响应内容。"""t1 = time.time()response = chat_with_gpt(model_class.api_key, message, model=model_class.name, url=model_class.base_url)t2 = time.time()print(f"Time taken for {model_class.name}: {t2 - t1} seconds")return response,round(t2-t1,4)import concurrent.futures
# 定义不同的消息
messages = [[{"role": "user", "content": "你是谁"}],[{"role": "user", "content": "你是谁"}],[{"role": "user", "content": "你是谁"}],[{"role": "user", "content": "你是谁"}],[{"role": "user", "content": "你是谁"}],[{"role": "user", "content": "你是谁"}],[{"role": "user", "content": "你是谁"}],[{"role": "user", "content": "你是谁"}],[{"role": "user", "content": "你是谁"}],[{"role": "user", "content": "你是谁"}],]# 定义模型列表
models = [ Llama]
durations = []
# 并发请求多个模型和不同的消息
with concurrent.futures.ThreadPoolExecutor() as executor:# 提交任务,每个任务使用不同的模型和消息futures = {executor.submit(chat_with_model, model, message): (model, message)for model in modelsfor message in messages}# 获取结果for future in concurrent.futures.as_completed(futures):model, message = futures[future]try:response,duration = future.result()durations.append(duration)print(f"Response from {model.name} with message {message}: {response}")except Exception as e:print(f"Error occurred with {model.name} and message {message}: {e}")
# llama
#[1.487, 5.2435, 6.6109, 7.9721, 9.3312, 10.737, 15.1935, 16.5562, 17.9155, 19.2751]# qwen
#[8.5853, 18.9962, 29.1533, 37.4593, 45.8992, 54.3415, 62.7779, 72.2762, 82.2203, 92.1694]print(durations)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/67739.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

微信小程序-base64加解密

思路:先创建一个base64.js的文件,这个文件可以作为专门加解密的文件模块,需要时就引用;创建好后,引用base64.js里的加解密函数。 注意:引用模块一定要引用正确的路径,否则会报错。 base64.js:…

150 Linux 网络编程6 ,从socket 到 epoll整理

1. 只能被一个client 链接 socket例子 此例子用于socket 例子, 该例子只能用于一个客户端连接server。 不能用于多个client 连接 server socket_server_support_one_clientconnect.c /* 此例子用于socket 例子, 该例子只能用于一个客户端连接server。 不…

C++《AVL树》

在之前的学习当中我们已经了解了二叉搜索树,并且我们知道二叉搜索树的查找效率是无法满足我们的要求,当二叉树为左或者右斜树查找的效率就很低下了,那么这本篇当中我们就要来学习对二叉搜索树进行优化的二叉树——AVL树。在此会先来了解AVL树…

2025年1月21日(树莓派点亮呼吸灯第一次修改)

系统信息: Raspberry Pi Zero 2W 系统版本: 2024-10-22-raspios-bullseye-armhf Python 版本:Python 3.9.2 已安装 pip3 支持拍摄 1080p 30 (1092*1080), 720p 60 (1280*720), 60/90 (640*480) 已安装 vim 已安装 git 学习目标:…

四、华为交换机 STP

生成树协议(STP)的核心目的是在存在冗余链路的网络中,构建一个无环的拓扑结构,从而防止网络环路带来的广播风暴等问题 一、STP 原理 选举根桥:网络中的每台交换机都会有一个唯一的桥 ID(BID)&am…

Elasticsearch——Elasticsearch索引管理实战

摘要 本文主要介绍了 Elasticsearch 中索引与索引模板的实战操作。首先讲解了索引管理,包括禁止自动创建索引、索引的格式、创建索引示例、修改索引示例、打开/关闭索引示例、删除索引、查看索引以及 Kibana 管理索引等内容。接着阐述了索引模板管理,涉…

Linux C\C++编程-文件位置指针与读写文件数据块

【图书推荐】《Linux C与C一线开发实践(第2版)》_linux c与c一线开发实践pdf-CSDN博客 《Linux C与C一线开发实践(第2版)(Linux技术丛书)》(朱文伟,李建英)【摘要 书评 试读】- 京东图书 Linu…

4.JoranConfigurator解析logbak.xml

文章目录 一、前言二、源码解析GenericXMLConfiguratorlogback.xml解析通过SaxEvent构建节点model解析model节点DefaultProcessor解析model 三、总结 一、前言 上一篇介绍了logback模块解析logback.mxl文件的入口, 我们可以手动指定logback.xml文件的位置, 也可以使用其它的名…

leetcode刷题记录(七十八)——105. 从前序与中序遍历序列构造二叉树

(一)问题描述 105. 从前序与中序遍历序列构造二叉树 - 力扣(LeetCode)105. 从前序与中序遍历序列构造二叉树 - 给定两个整数数组 preorder 和 inorder ,其中 preorder 是二叉树的先序遍历, inorder 是同一…

包文件分析器 Webpack Bundle Analyzer

webpack-bundle-analyzer 是一个非常有用的工具,用于可视化和分析 Webpack 打包生成的文件。这使得开发者能够更好地理解应用的依赖关系、包的大小,以及优化打包的机会。以下是关于 webpack-bundle-analyzer 的详细介绍,包括它的安装、使用以…

【PowerQuery专栏】PowerQuery提取XML数据

XML数据和Json 数据类型都是比较典型的层次数据类型,XML的数据格式非常的对称。所有的数据均是由标签对组成,图为典型的XML文件类型的数据。 在PowerQuery中进行XML数据类型解析采用的是Xml.Document 函数来进行文件内容的解析,Xml.Document 目前有三个可用参数。 参数1为数…

1.21学习记录

misc 2023isctf 你说爱我尊嘟假嘟 这题有点脑洞,需要把你说爱我换成Ook.将尊嘟换为Ook!假嘟换成Ook?(根据语气进行猜测吧)用在线工具解密最后用base64解密即可 2023isctf 杰伦可是流量明星 解压后是一个MP3文件&am…

leetcode_字符串 459. 重复的子字符串

459. 重复的子字符串 给定一个非空的字符串s,检查是否可以通过由他的一个子串重复多次构成思路: 首先判断字符串s是否为空或长度是否为1,若满足这两种条件,则说明不存在子字符串,返回False遍历所有可能的子串&#xf…

如何将自己本地项目开源到github上?

环境: LLMB项目 问题描述: 如何将自己本地项目开源到github上? 解决方案: 步骤 1: 准备本地项目 确保项目整洁 确认所有的文件都在合适的位置,并且项目的 README.md 文件已经完善。检查是否有敏感信息&#xff0…

【MySQL】数据库基础知识

欢迎拜访:雾里看山-CSDN博客 本篇主题:【MySQL】数据库基础知识 发布时间:2025.1.21 隶属专栏:MySQL 目录 什么是数据库为什么要有数据库数据库的概念 主流数据库mysql的安装mysql登录使用一下mysql显示数据库内容创建一个数据库创…

优化使用 Flask 构建视频转 GIF 工具

优化使用 Flask 构建视频转 GIF 工具 优化后的项目概述 在优化后的版本中,我们将实现以下功能: 可设置每个 GIF 的帧率和大小:用户可以选择 GIF 的帧率和输出大小。改进的用户界面:使用更现代的设计使界面更美观、整洁。自定义…

R 语言 | future 包,非阻塞的执行耗时脚本

目的:有一段代码,后面暂时用不到,但是又很耗时,占了当前R session,难道只能等半个小时,等到它结束才能画图? 可以使用R多线程,在支线中执行耗时任务,同时不阻塞当前R进程…

使用插件SlideVerify实现滑块验证

作者gitee地址:https://gitee.com/monoplasty/vue-monoplasty-slide-verify 使用步骤: 1、安装插件 npm install --save vue-monoplasty-slide-verify 2、在main.js中进行配置 import SlideVerify from vue-monoplasty-slide-verify; Vue.use(SlideV…

Windows配置frp内网穿透实现远程连接

仅个人记录 本文仅介绍客户端的配置 1. 开始 frp分为服务端和客户端,为实现内网穿透需要同时配置服务端和客户端,并且版本保持一致,可以前往 frp github下载 本文使用 0.51.2 版本,从GitHub下载并解压,得到如下文件…

“大模型横扫千军”背后的大数据挖掘--浅谈MapReduce

文章目录 O 背景知识1 数据挖掘2 邦费罗尼原则3 TF.IDF4 哈希函数5 分布式文件系统 一、MapReduce基本介绍1. Map 任务2. 按键分组3. Reduce 任务4. 节点失效处理5.小测验:在一个大型语料库上有100个map任务和若干reduce任务: 二、基于MapReduce的基本运…