模型部署与调用

目录

部署

ollama下载

模型版本选择 

​编辑 对照表

控制台执行

调用


部署

大模型部署我使用的是Ollama,点击跳转

接下来我将在本地使用ollama就行模型部署的演示

ollama下载

模型版本选择 

 对照表

大家可以根据自己的显卡配置选择对应的模型版本

控制台执行

执行部署 DeepSeek-R1 模型的命令后开始下载对应的模型

        到这里本地大模型就部署成功了,大家可以看到已经能够实现deepseek对话,但我们的目的是调用api对大模型进行使用

调用

import okhttp3.*;
import org.json.JSONObject;
import java.io.IOException;public class DeepSeekR1ApiClient {private static final String API_URL = "https://api.deepseek.com/v1/chat/completions";private static final String API_KEY = "your_api_key_here";private static final MediaType JSON = MediaType.get("application/json; charset=utf-8");public static void main(String[] args) {OkHttpClient client = new OkHttpClient();// 构建请求体JSONObject requestBody = new JSONObject();requestBody.put("model", "deepseek-r1");  // 指定R1模型JSONObject message = new JSONObject();message.put("role", "user");message.put("content", "你好,DeepSeek R1!");requestBody.put("messages", new JSONObject[] {message});// 可选参数requestBody.put("temperature", 0.7);      // 控制随机性requestBody.put("max_tokens", 1024);      // 最大输出token数Request request = new Request.Builder().url(API_URL).addHeader("Authorization", "Bearer " + API_KEY).post(RequestBody.create(requestBody.toString(), JSON)).build();try (Response response = client.newCall(request).execute()) {if (!response.isSuccessful()) {throw new IOException("请求失败: " + response.code() + " - " + response.message());}String responseBody = response.body().string();System.out.println("API响应: " + responseBody);// 解析响应JSONObject jsonResponse = new JSONObject(responseBody);String assistantReply = jsonResponse.getJSONArray("choices").getJSONObject(0).getJSONObject("message").getString("content");System.out.println("\nAI回复: " + assistantReply);} catch (IOException e) {System.err.println("请求发生错误: " + e.getMessage());e.printStackTrace();}}
}

当然除了上面的调用方式,还要多种不同的其他方式: 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/75226.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Rstudio如何使用Conda环境配置的R

前言 Rstudio作为一款流行的R语言集成开发环境(IDE),为用户提供了便捷的编程体验。然而,不同项目可能需要不同版本的R,这就需要我们灵活切换R版本。除了在之前文章中提到的使用 Docker 部署不同版本的 R 的方法之外&am…

C++---RAII模式

一、RAII模式概述 1. 定义 RAII(Resource Acquisition Is Initialization)即资源获取即初始化,是C中用于管理资源生命周期的一种重要编程模式。其核心在于将资源的获取和释放操作与对象的生命周期紧密绑定。当对象被创建时,资源…

【功能开发】DSP F2837x 检测中断所有函数运行一次的时间

要查看 DSP F28377 的 CPU 在 50 微秒一次的中断内所有程序运行完总共占用了中断多长时间,可以采用硬件定时器测量和软件计时两种常见方法。 方法一:使用硬件定时器测量 原理 利用 DSP 内部的高精度硬件定时器,在中断开始时记录定时器的值…

MAC环境给docker换源

2025-03-28 MAC环境给docker换源 在官网下载docker ,dmg 文件 参考: https://blog.csdn.net/qq_73162098/article/details/145014490 {"builder": {"gc": {"defaultKeepStorage": "20GB","enabled": true}},&q…

Vulnhub-zico2靶机打靶记录

本篇文章旨在为网络安全渗透测试靶机教学。通过阅读本文,读者将能够对渗透Vulnhub系列zico2靶机有一定的了解 一、信息收集阶段 靶机下载地址:https://download.vulnhub.com/zico/zico2.ova 因为靶机为本地部署虚拟机网段,查看dhcp地址池设…

【LeetCode 热题100】347:前 K 个高频元素(详细解析)(Go语言版)

🚀 力扣热题 347:前 K 个高频元素(详细解析) 📌 题目描述 力扣 347. 前 K 个高频元素 给你一个整数数组 nums 和一个整数 k,请你返回其中出现频率 前 k 高的元素。你可以按 任意顺序 返回答案。 &#x1f…

Java 大视界 -- Java 大数据机器学习模型在金融衍生品定价中的创新方法与实践(166)

💖亲爱的朋友们,热烈欢迎来到 青云交的博客!能与诸位在此相逢,我倍感荣幸。在这飞速更迭的时代,我们都渴望一方心灵净土,而 我的博客 正是这样温暖的所在。这里为你呈上趣味与实用兼具的知识,也…

深度学习入门:从神经网络基础到简单实现

深度学习作为人工智能领域最令人兴奋的技术之一,已经在图像识别、自然语言处理、语音识别等多个领域取得了突破性进展。本文将深入浅出地介绍深度学习的基本概念,并通过Python代码实现一个简单的神经网络模型,帮助读者建立直观理解并迈出实践第一步。 神经网络的基本原理 …

第2.6节 iOS生成全量和增量报告

2.6.1 简介 在采集了覆盖率数据后,就需要生成对应需求的全量和增量覆盖率报告,以便对测试进行查漏补缺。IOS系统有两种开发语言,所以生成报告的方式也不相同,下面就分别介绍一下Object C和Swift语言如何生成覆盖率报告。 2.6.2 O…

STM32技能综合巩固

一、深入理解ARMCPU架构及其指令格式、ARM汇编语言编程方法 1.汇编语言编程,实现LED灯 新建keil项目,选择芯片 选择运行环境以及配置 添加.s文件 汇编程序: AREAMYDATA,DATA AREAMYCODE,CODE ENTRY EXPORT__main __main MOVR0,#10 M…

P2Rank网页端:预测蛋白结合口袋+vina分子对接

P2Rank 是一种基于机器学习的蛋白质口袋预测工具,用于识别蛋白质结构中的潜在配体结合位点。它采用了一种基于物理特征的打分方法,结合随机森林(Random Forest)机器学习模型,以提高口袋预测的精确度。 该程序有在线工具…

安装windows server 2016没有可选硬盘,设备安装过ubuntu系统

如果在安装 Windows Server 2016 时无法识别已安装过 Ubuntu 的硬盘,可能是由于硬盘分区格式(如 ext4)与 Windows 不兼容,或缺少必要的驱动程序。以下是详细的解决方案: 1. 检查 BIOS/UEFI 设置 确认硬盘模式 • 重启电…

Debian系统_主板四个网口1个配置为WAN,3个配置为LAN

Debian系统_主板四个网口1个配置为WAN,3个配置为LAN 一、重新配置网口 1、查看当前网口的状态 ifconfig 或者 ip link show 或者 ls /sys/class/net 2、修改网络配置文件 sudo vi /etc/network/interfaces 注意WAN口的网关地址如果是192.168.3.1的话,L…

springboot整合Thymeleaf web开发出现Whitelabel Error Page

背景 在做java端上应用开发的时候,从资源和部署操作成本两方面考虑,一般会将前端的静态资源直接与后端应用一起打包,通过springboot内嵌的Tomcat提供web服务。进入web首页登录一直到后续业务流程正向操作,页面都能正常加载静态资…

JavaScript元素尺寸与位置

目录 client 家族与 offset 家族 一、client 家族:内容区域 内边距 示例代码 应用场景 二、offset 家族:内容区域 内边距 边框 滚动条 示例代码 应用场景 三、综合应用场景 1. 动态调整元素高度 2. 拖拽元素 3. 判断元素是否在视口内 四…

GZ073网络系统管理赛项赛题第1套模块A:网络构建解题笔记

2. 设备 接口或VLAN VLAN名称 二层或三层规划 说明 S1 VLAN10 CAIWU Gi0/1至Gi0/4 财务部 VLAN20 XIAOSHOU Gi0/5至Gi0/8 销售部 VLAN30 YANFA Gi0/9至Gi0/12 研发部 VLAN40 SHICHANG Gi0/13至Gi0/16 市场部 VLAN50 AP Gi0/20至Gi0/21 无线AP管理 VL…

jmeter web压力测试 压测

下载地址 Apache JMeter - Download Apache JMeter 1. 设置线程组 2. 设置http请求头 3. 设置http请求体 4. 设置结果条目 常用函数 ${__RandomString(8, abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ0123456789)}${__javaScript( ${__Random(1000, 10000)} /…

大语言模型(LLM)应用开篇 | RAG方法论概述 | 构建知识库探索

大型语言模型应用开篇 | RAG技术 | 构建知识库探索 1、大语言模型(LLM)应用开篇2、RAG技术2.1 基于RAG实现知识库问答系统的基本步骤2.2 RAG与其他技术的关系与区别 1、大语言模型(LLM)应用开篇 现在是2025年,DeepSeek…

fbx bip互转 测试OK

目录 fbx bip互转 3dmax插件fbx转bip: 测试可以转: MotionBuilder fbx转bip fbx bip互转 3dmax插件fbx转bip: 测试可以转: 不用插件!!无脑把Mxiamo转bip骨骼动画 - CG软件插件脚本交流 - Powered by Discuz!

8个实用销售工具

CRM系统(客户关系管理系统) 特点:能集中管理客户信息,如联系方式、交易记录、偏好等,还可对销售流程进行自动化管理。 用途:帮助销售团队跟踪客户,分析客户行为,预测销售趋势&am…