3. 第三放平台部署deepseek

有时候我们会发现使用deepseek服务器,异常卡顿,这是由于多方面原因造成的,比如说访问人数过多等。想要解决这个问题,我们可以选择第三方平台进行部署

第三方平台

我们可以选择的第三方平台很多,比如硅基流动、秘塔搜索、百度千帆等,常见平台官网如下

  • 阿里云:https://pai.console.aliyun.com/#/quick-start/models.
  • 腾讯云:https://console.cloud.tencent.com/tione/v2/aimarket/detail/deepseek series?regionld=1&detailTab=introducee
  • cursor:https://cursor.com 需要cursor会员
  • grok:https://groq.com/蒸馏版llama 70b,中文能力不足
  • 国家超算中心:https://www.scnet.cn/ui/mall/
  • 硅基流动:https://siliconflow.cn/zh-cn/models

我们以硅基流动为例来介绍第三方平台部署

部署

  1. 打卡硅基流动官网,我们可以看到他可以使用的模型在这里插入图片描述

  2. 我们以V3模型为例来进行部署,点击第一行第二个模型,他会出现模型的详情信息在这里插入图片描述

  3. 我们可以在线体检,也可以看api文档进行部署,我们打开API文档,在左侧我们可以看到它支持的接口在这里插入图片描述,右侧就是相关的例子了

  4. 我们以创建文本对话为例来进行部署,以官网为例写下如下代码

import requestsurl = "https://api.siliconflow.cn/v1/chat/completions"payload = {"model": "Qwen/QwQ-32B","messages": [{"role": "user","content": "What opportunities and challenges will the Chinese large model industry face in 2025?"}],"stream": False,"max_tokens": 512,"stop": None,"temperature": 0.7,"top_p": 0.7,"top_k": 50,"frequency_penalty": 0.5,"n": 1,"response_format": {"type": "text"},"tools": [{"type": "function","function": {"description": "<string>","name": "<string>","parameters": {},"strict": False}}]
}
headers = {"Authorization": "Bearer <token>","Content-Type": "application/json"
}response = requests.request("POST", url, json=payload, headers=headers)print(response.text)

对于代码解释

这段代码是使用 Python 的 requests 库向 SiliconFlow API 发送一个 POST 请求,调用 Qwen/QwQ-32B 大语言模型,并获取其对 “2025年中国大模型产业面临的机遇与挑战” 这个问题的回答。

1. 请求目标(API 端点)
url = "https://api.siliconflow.cn/v1/chat/completions"

• 这是 SiliconFlow 提供的 Chat Completions API,用于与大模型对话。

2. 请求数据(Payload)
payload = {"model": "Qwen/QwQ-32B",  # 指定调用的模型"messages": [{"role": "user",  # 用户角色"content": "What opportunities and challenges will the Chinese large model industry face in 2025?"  # 用户提问}],"stream": False,  # 是否流式返回(False 表示一次性返回完整回答)"max_tokens": 512,  # 限制返回的最大 token 数量(防止回答过长)"temperature": 0.7,  # 控制回答的随机性(0-1,越高越有创意)"top_p": 0.7,  # 控制生成多样性(类似 temperature)"top_k": 50,  # 限制采样范围(仅从 top_k 个最可能的 token 中选择)"frequency_penalty": 0.5,  # 降低重复内容的概率"n": 1,  # 只生成 1 个回答"response_format": {"type": "text"},  # 返回纯文本格式"tools": [...]  # (可选)用于函数调用,但这里未实际使用
}

model: 指定调用的模型(这里是 Qwen/QwQ-32B)。
messages: 对话历史,这里只有用户的一条提问。
stream: 是否流式返回(False 表示一次性返回完整回答)。
max_tokens: 限制回答长度(防止过长)。
temperaturetop_ptop_k: 控制回答的随机性和多样性。
frequency_penalty: 减少重复内容。
tools: 可用于 函数调用(Function Calling)

3. 请求头(Headers)
headers = {"Authorization": "Bearer <token>",  # 替换为你的 API Key"Content-Type": "application/json"  # 告诉服务器发送的是 JSON 数据
}

Authorization: 需要替换 <token> 为你的 SiliconFlow API Key(否则会返回 401 未授权错误)。
Content-Type: 指定数据格式为 application/json

4. 发送请求
response = requests.request("POST", url, json=payload, headers=headers)

• 使用 requests.post() 发送 POST 请求,传递 payload(JSON 格式)和 headers(包含认证信息)。

5. 打印响应
print(response.text)

• 打印 API 返回的 JSON 格式 的完整响应。

对于各个参数的取值,官网会有更详细的说明,点击

申请API KEY

在代码中,我们需要替换<token>,也就是API KEY来进行正确的调用,所以我们应该先进行申请 API KEY

  1. 进入申请API KEY 的页面,并登录

  2. 点击新建API KEY 在这里插入图片描述

  3. 点击余额充值,我们可以看到剩余的金额在这里插入图片描述

  4. 新建好后,我们将API KEY替换,运行上面代码,得到如下回答

{"id": "0195e27f092c94bd150980adec837ef5","object": "chat.completion","created": 1743261731,"model": "Qwen/QwQ-32B","choices": [{"index": 0,"message": {"role": "assistant","content": "","reasoning_content": "Okay, the user is asking about the opportunities and challenges the Chinese large model industry will face in 2025. Hmm, I need to break this down. First, I should consider what tools are available. The provided functions might include something like a market analysis tool or a future prediction model.\n\ nLooking at the tools given,there 's a function called \"analyze_market_trends\" which takes parameters like region, industry, and year. That seems relevant here. The user is focusing on China's large model industry,so region would be\ "China\", industry \"AI/ML\" or \"Large Language Models\", and year 2025.\n\nWait, the parameters for analyze_market_trends include region (string), industry (string), year (integer), and maybe others like specific_subsector. Since the question is about large models specifically, maybe adding \"large language models\" as the specific_subsector would help narrow it down.\n\nI should also check if there's another function called \"predict_future_impact\" which takes technology (string), region (string), timeframe (string like \"2025\"), and factors like economic, regulatory. That could cover both opportunities and challenges by considering different factors.\n\nSo combining both functions might give a comprehensive answer. First use analyze_market_trends to get market trends in China's AI/ML sector focusing on large models by 2025. Then use predict_future_impact to look at technological, economic, regulatory factors affecting them.\n\nWait but the user's question is about opportunities and challenges specifically. The functions might already capture that in their outputs. Let me make sure each function's parameters are correctly filled. For analyze_market_trends: region China, industry \"AI/ML\", year 2025, specific_subsector \"large language models\". For predict_future_impact: technology \"large language models\", region China, timeframe \"2025\", factors including economic, regulatory, technological.\n\nI need to structure the tool calls correctly in XML tags as specified. Each tool_call should be separate. Let me format that properly.\n","tool_calls": [{"id": "0195e27f26b353d40e8c41265d8faa9f","type": "function","function": {"name": "analyze_market_trends","arguments": "{\"region\": \"China\", \"industry\": \"AI/ML\", \"year\": 2025, \"specific_subsector\": \"large language models\"}"}}]},"finish_reason": "tool_calls"}],"usage": {"prompt_tokens": 140,"completion_tokens": 512,"total_tokens": 652},"system_fingerprint": ""
}

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/73857.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

1.4-蜜罐\堡垒机\API接口

1.4-蜜罐\堡垒机\API接口 蜜罐&#xff1a;用来钓鱼或诱惑测试人员的防护系统 bash <(curl -sS -L https://hfish.net/webinstall.sh) # 安装HFISH蜜罐堡垒机&#xff1a; 运维用的&#xff0c;统一管理运维平台;拿下堡垒机就很有可能等于拿下了多个平台 jumpServer一键安…

知识图引导的检索增强生成

摘要 检索增强生成&#xff08;RAG&#xff09;已经成为一种很有前途的技术&#xff0c;用于解决大型语言模型&#xff08;LLM&#xff09;生成的响应中的幻觉问题。现有的RAG研究主要集中在应用基于语义的方法来提取孤立的相关组块&#xff0c;忽略了它们之间的内在关系。在本…

【机器学习】imagenet2012 数据预处理数据预处理

【机器学习】数据预处理 1. 下载/解压数据2. 数据预处理3. 加载以及训练代码3.1 使用PIL等加载代码3.2 使用OpenCV的方式来一张张加载代码3.3 h5的方式来加载大文件 最后总结 这个数据大约 140个G,128w的训练集 1. 下载/解压数据 首先需要下载数据&#xff1a; 数据最后处理…

质量工程:数字化转型时代的质量体系重构

前言&#xff1a;质量理念的范式转移阅读原文 如果把软件开发比作建造摩天大楼&#xff1a; 传统测试 竣工后检查裂缝&#xff08;高成本返工&#xff09; 质量工程 从地基开始的全流程监理体系&#xff08;设计图纸→施工工艺→建材选择→竣工验收&#xff09; IEEE研究…

【全栈开发】—— Paddle OCR 文字识别 + deepseek接入(基于python 最新!!!)

所有源码都在文章中&#xff0c;大家不要私信来要源码&#xff0c;当然&#xff0c;评论区欢迎交流技术 目录 Paddle OCR 配置环境 示例 deepseek接入 环境配置 api 调用代码 sliconflow Paddle OCR 配置环境 清华源下载 paddlepaddle&#xff1a; pip install paddlepaddle …

SAIL-RK3588J 核心板技术方案——高精度装配式建筑机器人控制‌

&#xff08;本方案契合《建筑机器人产业目录》政策要求&#xff09; 一、方案背景与政策支持‌ ‌政策驱动‌ 2025年2月《建筑机器人产业目录》明确将‌“高精度建筑机器人控制设备”‌纳入重点补贴范围&#xff0c;要求定位精度≤0.5mm、支持实时质检与多机协同&#xff0c…

OpenAI API - 快速入门开发

文章目录 开发者快速入门分析图像输入使用工具扩展模型提供闪电般的 AI 体验构建代理进一步探索 模型精选模型推理模型旗舰聊天模型成本优化模型实时模型旧版 GPT 模型DALLE文本转语音转写嵌入调度工具特定模型GPT 基础模型 Libraries创建和导出 API 密钥安装官方 SDKJavaScrip…

蓝桥杯省赛 棋盘 3533 二维差分+二维前缀和

传送门 0棋盘 - 蓝桥云课 const int N 2e3 10;int n,m; int a[N][N];void insert(int x11,int y11,int x22,int y22) {a[x11][y11] ;a[x11][y22 1] --;a[x22 1][y11] --;a[x22 1][y22 1] ; }void solve() {cin >> n >> m;for (int i 1;i < m;i ){int x11…

《C++Linux编程进阶:从0实现muduo 》-第6讲.C++死锁问题如何分析调试-原子操作,互斥量,条件变量的封装

重点内容 视频讲解&#xff1a;《CLinux编程进阶&#xff1a;从0实现muduo C网络框架系列》-第6讲.C死锁问题如何分析调试-原子操作,互斥量,条件变量的封装 代码改动 lesson6代码 实现&#xff1a;base/Atomic.h 实现&#xff1a;base/Mutex.h 实现&#xff1a;base/Condit…

洛谷题单1-P5708 【深基2.习2】三角形面积-python-流程图重构

题目描述 一个三角形的三边长分别是 a a a、 b b b、 c c c&#xff0c;那么它的面积为 p ( p − a ) ( p − b ) ( p − c ) \sqrt{p(p-a)(p-b)(p-c)} p(p−a)(p−b)(p−c) ​&#xff0c;其中 p 1 2 ( a b c ) p\frac{1}{2}(abc) p21​(abc)。输入这三个数字&#xff…

matplotlib标题比x,y轴字体大,明明标题字体更大?

原始代码&#xff1a; plt.xlabel(训练轮次&#xff08;Epochs&#xff09;, fontsize14, fontweightbold, fontpropertieschinese_font) # 设置中文字体、加大、加粗 plt.ylabel(R值, fontsize14, fontweightbold, fontpropertieschinese_font) # 设置中文字体、加大、加粗…

Baklib内容中台的核心优势是什么?

智能化知识管理引擎 Baklib的智能化知识管理引擎通过多源数据整合与智能分类技术&#xff0c;实现企业知识资产的自动化归集与动态更新。系统内置的语义分析算法可自动识别文档主题&#xff0c;结合自然语言处理技术生成结构化标签体系&#xff0c;大幅降低人工标注成本。针对…

Android学习总结之ContentProvider跨应用数据共享

在 Android 开发中&#xff0c;跨应用数据共享是构建开放生态的关键需求。作为四大组件之一&#xff0c;ContentProvider通过标准化接口和安全机制&#xff0c;成为实现这一需求的核心枢纽。本文将围绕其生命周期方法、核心机制、自定义实现及最佳实践展开&#xff0c;帮助开发…

计算机底层基石:原码、反码、补码、移码深度剖析

在计算机的世界里&#xff0c;所有数据最终都以二进制的形式进行存储与运算。原码、反码、补码和移码作为二进制数据的重要编码方式&#xff0c;对计算机实现高效数据处理起着关键作用。接下来&#xff0c;我们将深入剖析这几种编码。​ 一、原码​ 1.1 定义​ 原码是最简单…

Bitnode和Bitree有什么区别 为什么Bitree前多了*

Bitnode 和 Bitree 的区别在于它们的类型定义和用途&#xff1a; Bitnode: 这是一个结构体类型&#xff0c;表示二叉树中的一个节点。 它包含三个成员&#xff1a; data&#xff1a;存储节点的数据&#xff08;这里是 char 类型&#xff09;。 lchild&#xff1a;指向左子节点…

AI 时代,我们该如何写作?

当ChatGPT/DeepSeek能在几秒钟内产出一篇文章&#xff0c;而且生成能力日益精进&#xff0c;你是否也曾思考&#xff0c;我还能做什么&#xff1f; 当2024年AI开始进入人们的视野&#xff0c;我在CSDN 上的博客也悄然发生了变化&#xff0c;以前一篇文章发布后&#xff0c;阅读…

第三卷:覆舟山决战(73-108回)正反人物群像

第三卷&#xff1a;覆舟山决战&#xff08;73-108回&#xff09;正反人物群像 核心矛盾&#xff1a;寒门称帝→权力异化→历史循环 主题&#xff1a;通过人物群像展现屠龙者成魔的必然性与制度压迫的永恒性 一、正派阵营&#xff08;理想主义残余&#xff09; 1. 檀道济&…

vscode 通过Remote-ssh远程连接服务器报错 could not establish connection to ubuntu

vscode 通过Remote-ssh插件远程连接服务器报错 could not establish connection to ubuntu&#xff0c;并且出现下面的错误打印&#xff1a; [21:00:57.307] Log Level: 2 [21:00:57.350] SSH Resolver called for "ssh-remoteubuntu", attempt 1 [21:00:57.359] r…

Nginx RTMP DASH 模块分析 (ngx_rtmp_dash_module.c)

ngx_rtmp_dash_module.c实现了一个 Nginx RTMP 模块&#xff0c;主要功能是支持通过 DASH&#xff08;动态自适应流媒体&#xff09;协议进行流媒体发布。DASH&#xff08;Dynamic Adaptive Streaming over HTTP&#xff09;是一种流行的视频流协议&#xff0c;它允许根据网络状…

飞书电子表格自建应用

背景 coze官方的插件不支持更多的飞书电子表格操作&#xff0c;因为需要自建应用 飞书创建文件夹 创建应用 开发者后台 - 飞书开放平台 添加机器人 添加权限 创建群 添加刚刚创建的机器人到群里 文件夹邀请群 创建好后&#xff0c;就可以拿到id和key 参考教程&#xff1a; 创…