利用JAVA语言调用GLM-4接口实战指南

一、什么是API接口

API(Application Programming Interface,应用程序编程接口)是一种软件接口,它定义了不同应用程序之间如何相互通信、交互。API接口分为很多种,常见的有Web API,数据库API,操作系统API等。

Web API是目前最流行的API接口,它作为一种开放式API接口,能够让不同的系统与平台进行交互。Web API可以返回JSON格式的数据或XML格式等数据。

二、GLM-4模型介绍

GLM-4是智谱AI发布的新一代基座大模型,整体性能相比GLM3提升60%,支持128K上下文,可根据用户意图自主理解和规划复杂指令、完成复杂任务。

2.1 主要模型

模型名称模型简介上下文长度
GLM-4提供了更强大的问答和文本生成能力。适合于复杂的对话交互和深度内容创作设计的场景。128K
GLM-4V实现了视觉语言特征的深度融合,支持视觉问答、图像字幕、视觉定位、复杂目标检测等各类图像理解任务2K
GLM-3-Turbo适用于对知识量、推理能力、创造力要求较高的场景,比如广告文案、小说写作、知识类写作、代码生成等。128K

2.2 计费单价

模型名称计费单位
GLM-40.1元 / 千tokens
GLM-4V0.1元 / 千tokens
GLM-3-Turbo0.005元 / 千tokens

一般情况下ChatGLM模型中token和字数的换算比例约为1:1.6,但因为不同模型的分词不同,所以换算比例也存在差异,每一次实际处理token数量以模型返回为准,您可以从返回结果的usage中查看。

2.3 计费范围

根据模型输入和输出的总token数进行计量计费(向量大模型embedding-2仅按照输入token量计费、图像大模型按照调用次数计费),如果您开启工具调用,调用结果作为输入也会进行计量计费。

调用工具可以为模型引入更多相关信息,有助于提高输出的质量、及时性等;语言模型默认开启web_search,调用成功后将作为参考信息输入给模型,每次调用大约会增加1000 tokens的消耗。如果您不需要调用web_search,可以通过参数关闭。

需关注的是,若您在体验中心对指定模型进行体验,收费规则和 API 调用一致。

2.4 扣费方式

支持下列2种方式扣减:

方式说明
费用扣减扣减费用 = token使用量 x 模型单价,对应费用将从您的充值账户、赠金账户进行扣减(如果您多个账户同时存在余额,我们将等额扣减,举例费用为10元,则充值帐户、赠金账户各扣减5元)
资源包扣减扣减数量 = token使用量,对应额度将从您的资源包账户进行扣减(如无特殊逻辑限制*,当资源包存在余额时,我们默认将优先扣减资源包账户再扣减充值 / 赠金账户)

实际收费情况请关注官方信息

三、调用API

3.1 申请API Key

快速查找API,可以通过幂简集成-API HUB查找所需的各种AI API。

所有 API 使用 API Key 进行身份验证。可以在GLM-4的服务详情界面快速理解服务,并从官方处获取API Key。

4. 基于SDK开发

4.1 Maven引入SDK

<dependency><groupId>cn.bigmodel.openapi</groupId><artifactId>oapi-java-sdk</artifactId><version>release-V4-2.0.2</version>
</dependency>

4.2 代码实现

import com.alibaba.fastjson.JSON;
import com.zhipu.oapi.ClientV4;
import com.zhipu.oapi.Constants;
import com.zhipu.oapi.service.v4.model.*;import java.util.ArrayList;
import java.util.List;public class GLM4Demo {public static final String API_KEY = "你的APK KEY";private static final String requestIdTemplate = "miitang-%d";public static String chatGLM4(String message) {ClientV4 client = new ClientV4.Builder(API_KEY).build();List<ChatMessage> messages = new ArrayList<>();//构建消息对象ChatMessage chatMessage = new ChatMessage(ChatMessageRole.USER.value(), message);messages.add(chatMessage);//构建请求idString requestId = String.format(requestIdTemplate, System.currentTimeMillis());ChatCompletionRequest chatCompletionRequest = ChatCompletionRequest.builder().model(Constants.ModelChatGLM4)//设置模式.stream(Boolean.FALSE).invokeMethod(Constants.invokeMethod).messages(messages).requestId(requestId).build();ModelApiResponse invokeModelApiResp = client.invokeModelApi(chatCompletionRequest);return JSON.toJSONString(invokeModelApiResp);}public static void main(String[] args) {String result = chatGLM4("请做一下自我介绍");System.out.println(result);}}

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/30483.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Perl语言快速入门学习

1. 引言 Perl&#xff08;Practical Extraction and Report Language&#xff09;是一种功能强大且灵活的编程语言&#xff0c;广泛应用于文本处理、系统管理、网络编程等领域。本文将带领大家了解Perl语言的基础知识&#xff0c;帮助初学者快速入门。 2. 什么是Perl&#xf…

数据结构-算法和算法分析

目录 前言一、算法1.1 算法与程序1.2 算法描述方法1.3 算法特性1.4 算法设计的要求 二、算法分析2.1 算法时间效率的度量2.1.1 事前分析方法算法的渐进时间复杂度算法时间复杂度分析例子算法最坏时间复杂度时间复杂度的计算规则 2.2 算法空间效率的度量 总结 前言 程序 数据结…

如何相互转换图片格式?如何转换jpg、bmp、png格式?

图片的格式有很多种&#xff0c;常见的有jpg、bmp、png格式&#xff0c;这些格式本质上没有太大区别&#xff0c;安卓和电脑都可以直接打开查看&#xff0c;但有时还是会用到一些固定的格式&#xff0c;例如&#xff0c;上传个人信息时&#xff0c;如果图片格式不符合要求&…

参数量Params和每秒浮点运算次数FLOPs的单位是多少

先看一下yolov8的表 模型计算量(FLOPs)和参数量(Params)是衡量深度学习算法复杂度的两个重要指标&#xff0c;它们可以用来评估一个模型的性能和实用性。以下是对这两个指标的理解&#xff1a; 1、Params - 参数量 即模型中需要学习的参数数量&#xff0c;它是衡量模型复杂度的…

pytorch基础【4】梯度计算、链式法则、梯度清零

文章目录 梯度计算计算图&#xff08;Computational Graph&#xff09;梯度求导&#xff08;Gradient Computation&#xff09;函数与概念 示例代码更多细节梯度求导的过程梯度求导的基本步骤示例代码注意事项总结 链式法则是什么&#xff1f;链式法则的数学定义链式法则在深度…

VMR,支持30+种编程语言的SDK版本管理器,支持Windows/MacOS/Linux。

官方文档地址&#xff1a;documents 官方项目地址&#xff1a;github 欢迎安装使用&#xff0c;分享转发&#xff0c;前往github star。 跨平台&#xff0c;支持Windows&#xff0c;Linux&#xff0c;MacOS支持多种语言和工具&#xff0c;省心受到lazygit的启发&#xff0c;拥…

Flutter【组件】可折叠文本组件

简介 flutter 可折叠文本组件。 点击展开&#xff0c;收起折叠文本。支持样式自定义 github地址&#xff1a; github.com/ThinkerJack… pub地址&#xff1a;https://pub.dev/packages/jac_uikit 展开收起文本 使用方式&#xff1a; ExpandableText(content: 测试 * 50,ma…

qt基于QGraphicsView的屏幕旋转

一、代码实现 实现代码示例 MainWindow2 w;QGraphicsScene *scene new QGraphicsScene;QGraphicsProxyWidget *gw scene->addWidget(&w);// 旋转角度gw->setRotation(90);QGraphicsView *view new QGraphicsView(scene);//view->resize(1024, 600);//scene-&g…

生活实用口语柯桥成人外语培训机构“客服”用英文怎么说?

● 01. “客服”英语怎么说&#xff1f; ● 我们都知道“客服”就是“客户服务”&#xff0c; 所以Customer Service就是#15857575376客服的意思。 但是这里的“客服”指代的不是客服人员&#xff0c; 而是一种Service服务。 如果你想要表达客服人员可以加上具体的职位&a…

中国500米分辨率年平均LAI数据集(2000-2020)

叶面积指数LAI(Leaf Area Index)是描述植被冠层几何结构的基本参数之一&#xff0c;被定义为单位地表面积上所有叶片面积的倍数&#xff0c;它控制着植被的许多生物物理过程&#xff0c;如光合作用、呼吸作用、蒸腾作用、碳循环和降水截获等&#xff0c;是陆面过程一个十分重要…

CF 952 E.Secret Box

原题链接&#xff1a;Problem - E - Codeforces 题目大意&#xff1a;多组测试数据&#xff0c;给一个大长方体的长宽高和一个小长方体的体积&#xff0c;问小长方体最大能在大长方体里面放多少种不同的位置。 思路&#xff1a;枚举小长方体的长和宽&#xff0c;然后判断高能…

安装免费版的jfrog artifactory oss

1、下载 软件&#xff0c;本案例安装的是 jfrog-artifactory-oss-7.59.11-linux.tar.gz https://releases.jfrog.io/artifactory/bintray-artifactory/org/artifactory/oss/jfrog-artifactory-oss/ 2、解压下载下来的压缩包 tar zxf jfrog-artifactory-oss-7.59.11-linux.tar…

Excel数据格式:XLSX vs CSV 使用Python处理数据的优劣比较

Excel数据格式 [TOC](Excel数据格式)Excel数据格式&#xff1a;XLSX vs CSV 使用Python处理数据的优劣比较**XLSX格式****CSV格式****使用Python导出数据的推荐****总结** Excel数据格式&#xff1a;XLSX vs CSV 使用Python处理数据的优劣比较 在数据科学和编程领域&#xff0…

机器学习与模式识别大作业

import plane # import dense import numpy as np from sklearn.cluster import KMeans# 注意行列和xy的转换 应该只用行列 向上为行-1 向左为列-1 # 如果在xy图像里面会上下颠倒&#xff0c;左右不变 # 地图上有三个信息来源&#xff0c;一个是字符地图&#xff0c;一个是带有…

10 种语言文本准确渲染;Mac无需联网的本地聊天应用;多模态语言模型(MLM)基准测试的引擎;Yolo DotNet版本

✨ 1: Glyph-ByT5 10 种语言文本准确渲染&#xff0c;将文本渲染的准确性从提高到近 90% &#xff0c;同时还能实现段落渲染自动布局 Glyph-ByT5是一种定制的文本编码器&#xff0c;旨在实现准确的文字视觉渲染。其核心思想是通过细致的字形-文本配对数据集的微调&#xff0c…

VBA技术资料MF161:按需要显示特定工作表

我给VBA的定义&#xff1a;VBA是个人小型自动化处理的有效工具。利用好了&#xff0c;可以大大提高自己的工作效率&#xff0c;而且可以提高数据的准确度。“VBA语言専攻”提供的教程一共九套&#xff0c;分为初级、中级、高级三大部分&#xff0c;教程是对VBA的系统讲解&#…

java spring-data-jpa 使用方法

Spring Data JPA 是 Spring 生态系统的一部分&#xff0c;它提供了对 JPA (Java Persistence API) 的抽象&#xff0c;简化了数据访问层的开发。 以下是使用 Spring Data JPA 的基本步骤和一些核心概念&#xff1a; 1. 添加依赖 在 Maven 项目的 pom.xml 文件中添加 Spring D…

uniapp实现内嵌其他网页的功能

一、用到的知识点 页面跳转页面间跳转&#xff0c;参数传递web-view使用 二、使用navigator 页面跳转。 navigator 组件类似HTML中的<a>组件&#xff0c;但只能跳转本地页面。目标页面必须在pages.json中注册。所以这么写是不行的&#xff1a; <navigator url&quo…

最新AI智能聊天对话问答系统源码(详细图文搭建部署教程)+AI绘画系统(Midjourney),DALL-E3文生图,TTS语音识别输入,文档分析

一、文章前言 随着人工智能技术的持续进步&#xff0c;AI绘画已经发展成为一个日益成熟的领域。越来越多的人开始尝试使用AI绘画软件来创作艺术作品。尽管这些AI绘画软件对绘画领域产生了显著影响&#xff0c;但它们并不会完全取代画师。与传统手绘不同&#xff0c;AI绘画可以…

ELISA Flex: Monkey IFN-γ (HRP)

ELISA Flex: Monkey IFN-γ (HRP)该ELISA试剂盒能够检测溶液样本比如细胞培养上清或者血清/血浆中猴子γ干扰素&#xff08;IFN-γ&#xff09;的含量。 产品组分&#xff1a; 捕获抗体&#xff1a;克隆号MT126L&#xff08;0.5mg/ml&#xff09; 检测抗体&#xff1a;克隆号7…