基于Tools体验NLP编程的魅力

大模型能理解自然语言,从而能解决问题,但是就像人类大脑一样,大脑只能发送指令,实际行动得靠四肢,所以LangChain4j提供的Tools机制就是大模型的四肢。

大模型的不足

大模型在解决问题时,是基于互联网上很多历史资料进行预测的,而且答案具有一定的随机性,那如果我问"今天是几月几号?",大模型是大概率答错的,因为大模型肯定还没有来得及学习今天所产生的最新资料。

比如:

package com.timi;import dev.langchain4j.model.chat.ChatLanguageModel;
import dev.langchain4j.model.openai.OpenAiChatModel;public class _04_Toos {public static void main(String[] args) {ChatLanguageModel model = OpenAiChatModel.builder().baseUrl("http://langchain4j.dev/demo/openai/v1").apiKey("demo").build();System.out.println(model.generate("今天是几月几号?"));}
}

代码执行结果为:

今天是十二月十九号。

多执行几次,每次执行结果很有可能不一样,所以如果要求大模型处理时间相关的问题,它就无能为力了。

因此,我们扩展一下,出现这种情况的原因是ChatGPT是基于历史数据来进行预测的,它没办法拿到当前最新的数据,比如说时间,从而限制了它的进一步使用,那么LangChain4j的Tools机制就能够帮助大模型来获取当前最新的数据,从而解决上述时间相关的问题。

由于LangChain4j提供的"demo"不支持Tools机制,需要大家自行获取OpenAI的ApiKey,或者找一些OpenAI的代理来间接的调用OpenAI的API。

ToolSpecification

首先需要定义一个工具,其实就是一个方法,用来返回当前日期,并且通过@Tool注解来描述该工具,从而使得大模型在需要获取当前时间时能够调用该工具方法得到当前时间:

@Tool("获取当前日期")
public static String dateUtil(){return LocalDateTime.now().toString();
}

然后将工具方法转成ToolSpecification对象,并传递给大模型:

package com.timi;import dev.langchain4j.agent.tool.Tool;
import dev.langchain4j.agent.tool.ToolSpecification;
import dev.langchain4j.agent.tool.ToolSpecifications;
import dev.langchain4j.data.message.AiMessage;
import dev.langchain4j.data.message.UserMessage;
import dev.langchain4j.model.chat.ChatLanguageModel;
import dev.langchain4j.model.openai.OpenAiChatModel;
import dev.langchain4j.model.output.Response;import java.time.LocalDateTime;
import java.util.Collections;public class _04_Tools {@Tool("获取当前日期")public static String dateUtil(){return LocalDateTime.now().toString();}public static void main(String[] args) throws NoSuchMethodException {ChatLanguageModel model = OpenAiChatModel.builder().baseUrl("http://localhost:3000/v1").apiKey("sk-peszVtFXoLnWK45bB15370Df6f344cAa9a088eF50f9c7302").build();ToolSpecification toolSpecification = ToolSpecifications.toolSpecificationFrom(_04_Tools.class.getMethod("dateUtil"));UserMessage userMessage = UserMessage.from("今天是几月几号?");Response<AiMessage> response = model.generate(Collections.singletonList(userMessage), toolSpecification);System.out.println(response.content());}
}

所以,一个ToolSpecification对象就代表一个工具,当用户把要问题UserMessage和工具ToolSpecification一起传递给大模型,大模型就知道要结合工具描述来解决用户的问题,此时大模型响应的AiMessage不再是一串文本,而是:

AiMessage { text = null toolExecutionRequests = [ToolExecutionRequest { id = "call_IPiiRjIM5PmVdDWjpXcUN5c7", name = "dateUtil", arguments = "{}" }] }

一个ToolExecutionRequest,表示一个工具执行请求,表示大模型在解决问题时,需要调用工具来解决用户的问题,由于我们可能传了多个工具给大模型,所以toolExecutionRequests是一个List,表示为了解决用户的问题需要调用哪些工具。

所以,我们在得到了ToolExecutionRequest后,就需要取执行对应的工具方法了,其中ToolExecutionRequest的name属性就是方法名,arguments就表示要传递给方法的参数值:

Response<AiMessage> response = model.generate(Collections.singletonList(userMessage), toolSpecification);AiMessage aiMessage = response.content();
if (aiMessage.hasToolExecutionRequests()) {for (ToolExecutionRequest toolExecutionRequest : aiMessage.toolExecutionRequests()) {String methodName = toolExecutionRequest.name();Method method = _04_Tools.class.getMethod(methodName);// result就是当前时间String result = (String) method.invoke(null);System.out.println(result);}
}

此时的输出结果为:

2024-03-24T11:37:02.618942

这就是大模型想要的当前时间,相当于是ToolExecutionRequest的响应结果,那我们该如何把这个响应结果告诉给大模型,从而让大模型告诉我“今天是几月几号?”呢?

前面在介绍ChatMessage类型时,除开有UserMessage、AiMessage、SystemMessage之外,还有一种类型就是ToolExecutionResultMessage,因此ToolExecutionResultMessage就表示工具执行结果,所以我们把工具的执行结果封装为ToolExecutionResultMessage即可:

ToolExecutionResultMessage toolExecutionResultMessage = ToolExecutionResultMessage.from(toolExecutionRequest.id(), toolExecutionRequest.name(), result);

然后使用历史对话的思想,把以上用户和大模型之间涉及到的ChatMessage按顺序添加到List中发送给大模型即可:

ToolExecutionResultMessage toolExecutionResultMessage = ToolExecutionResultMessage.from(toolExecutionRequest.id(), toolExecutionRequest.name(), result);AiMessage message = model.generate(Lists.newArrayList(userMessage, aiMessage, toolExecutionResultMessage)).content();
System.out.println(message.text());

这样大模型就能正确的告诉当前时间了:

今天是2024324日。

AiServices整合Tools

以上使用Tools的方式有点复杂,如果大模型要解决一个复杂问题需要调用多个工具或多轮工具调用,以上代码就更不合适了,而AiServices能简化这个过程。

假如有这么一个需求:获取今天注册的所有新用户信息,对于这个需求我们可以这么来实现。

首先定义一个User对象:

static class User {private String username;private Integer age;public User(String username, Integer age) {this.username = username;this.age = age;}
}

然后定义两个Tools:

static class MyTools {@Tool("获取当前日期")public static String dateUtil(String onUse) {return LocalDateTime.now().toString();}@Tool("获取指定日期注册的用户信息")public static List<User> getUserInfo(String date) {System.out.println("接收到的date参数的值:" + date);User user1 = new User("司马懿", 18);User user2 = new User("曹操", 18);return Lists.newArrayList(user1, user2);}
}

一个用来获取当前时间,一个接收当前时间并返回用户信息。

再定义一个UserService接口:

interface UserService {@SystemMessage("先获取具体日期,然后再解决用户问题")String getUserInfo(String desc);
}

然后利用AiServices创建UserService接口的代理对象:

public static void main(String[] args) {ChatLanguageModel model = ZhipuAiChatModel.builder().apiKey("0f4d2b0e8d95f48e6e1f138b881d0a53.UkIov25cJBSvjFDo").build();UserService userService = AiServices.builder(UserService.class).chatLanguageModel(model).tools(new MyTools()).chatMemory(MessageWindowChatMemory.withMaxMessages(10)).build();String userInfo = userService.getUserInfo("获取今天的注册的新用户信息");System.out.println(userInfo);}

并执行getUserInfo()方法,传入你的描述信息就可以获取到User信息了。比如以上代码的执行结果为:

接收到的date参数的值:2024-04-21
2024420日注册的用户有司马懿和曹操,他们的年龄都是18岁。

源码分析

在代理对象的invoke()方法中,以下代码会去调用大模型的底层API:

Response<AiMessage> response = context.toolSpecifications == null? context.chatModel.generate(messages): context.chatModel.generate(messages, context.toolSpecifications);

当指定了Tools时,就会调用context.chatModel.generate(messages, context.toolSpecifications),我们debug来看下返回结果:
image.png
第一次响应是一个ToolExecutionRequest工具执行请求,name为"now",表示要执行now()方法,也就是获取当前时间,然后会执行如下代码:

for (ToolExecutionRequest toolExecutionRequest : aiMessage.toolExecutionRequests()) {// 执行工具ToolExecutor toolExecutor = context.toolExecutors.get(toolExecutionRequest.name());// 工具执行结果String toolExecutionResult = toolExecutor.execute(toolExecutionRequest, memoryId);// 把工具执行请求和结果封装为ToolExecutionResultMessageToolExecutionResultMessage toolExecutionResultMessage = ToolExecutionResultMessage.from(toolExecutionRequest,toolExecutionResult);// 添加到ChatMemory中chatMemory.add(toolExecutionResultMessage);
}

然后执行以下代码,再次请求大模型,此时ChatMemory中包含了第一次工具请求的结果:

response = context.chatModel.generate(chatMemory.messages(), context.toolSpecifications);

这一次得到的响应是:
image.png
仍然是一个工具执行请求,只不过方法时getUserInfo()方法,并且入参为上一步工具调用的结果,然后和上面类似,处理该工具执行请求,也就是执行getUserInfo()方法得到工具执行结果,同样再次把第二次的工具执行请求和结果封装为ToolExecutionResultMessage,并添加到ChatMemory中,此时ChatMemory中的内容为:
image.png
依次为:用户的问题、第一次工具执行请求和结果、第二次工具执行请求和结果。

把最终的ChatMemory发送给大模型之后,大模型就知道了今天注册的新用户信息有哪些了,就会把结果返回给你:
image.png
基于此,我们其实打通了大模型和我们系统内部数据之间的桥梁,使得大模型能够调用我们提供的工具来获取系统内部的最新数据,而我们可以更进一步让大模型基于这些数据来做更智能的事情,比如:

需求改为:“获取今天注册的新用户信息,然后基于这些用户发送一份邮件”,我们只需要再定义一个发送邮件Tool就可以了:

@Tool("给指定用户发送邮件")
public void email(String user) {System.out.println("发送邮件:" + user);
}

然后:

List<User> users = userService.getUserInfo("获取今天注册的新用户信息,然后基于这些用户发送一份邮件");

代码执行结果为:

接收到的date参数的值:2024-04-21
发送邮件:司马懿,曹操
今天注册的用户有司马懿和曹操,已经给他们发送了一份邮件。

通过这个Demo,我们发现,我们可以利用自然语言来整合各项系统功能,这将是一种新的编程模式:自然语言编程。

本节总结

本节我们学习了LangChain4j中的Tools机制,通过Tools机制可以通过自然语言整合大模型和系统内部功能,使得大模型这个智能大脑拥有了灵活的四肢,从而可以处理更复杂的场景,同时也感受到了自然语言编程离我们越来越近了,下一节我们将学习文本向量化以及向量模型、向量数据库,这是检索增强生成(RAG)的基础。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/38989.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Tomcat部署与优化

Tomcat部署与优化 Tomcat简述 server&#xff1a; 服务器&#xff0c;Tomcat运行的进程实例&#xff0c;一个Server中可以有多个service&#xff0c;但通常就一个 service&#xff1a;服务&#xff0c;用来组织Engine&#xff08;引擎&#xff09;和Connector&#xff08;连接…

gdb及其使用

gdb调试一&#xff1a; 首先进入gdb&#xff0c;确定好进程&#xff0c;输入进程号 确定要调试哪个文件&#xff0c;然后输入&#xff1a;&#xff08;b为打断点&#xff09; (gdb) b serialization_protobuffer.h:write<ros::serialization::OStream>(ros::serializat…

MySQL的limit关键字和聚合函数讲解

目录 一、MySQL数据库介绍二、MySQL聚合函数三、MySQL数据排序分组四、MySQL的limit关键字 一、MySQL数据库介绍 MySQL是一种广泛使用的开源关系型数据库管理系统&#xff0c;由瑞典MySQL AB公司开发&#xff0c;后被Sun Microsystems收购&#xff0c;最终成为Oracle公司的一部…

RANSAC空间圆拟合实现

由初中的几何知识我们可以知道&#xff0c;确定一个三角形至少需要三个不共线的点&#xff0c;因此确定一个三角形的外接圆至少可用三个点。我们不妨假设三个点坐标为P1(x1,y1,z1),P2(x2,y2,z2),P3(x3,y3,z3)。 圆方程的标准形式为&#xff1a; (xi-x)2(yi-y)2R2 &#xff08;1…

新火种AI|苹果要将苹果智能做成AI时代的APP Store?

作者&#xff1a;一号 编辑&#xff1a;美美 苹果还是想要自己做AI时代的“APP Store”。 自从去年开始落了队&#xff0c;苹果现在AI上开始高歌猛进。今年WWDC上展示的AI产品和与OpenAI的合作只是开始。有消息称&#xff0c;苹果正与Meta等AI巨头展开深入合作&#xff0c;这…

Spring底层原理之bean的加载方式四 @import 注解

bean的加载方式四 import 第四种bean的导入方式 是import导入的方式 在配置类上面加上注解就行 package com.bigdata1421.config;import com.bigdata1421.bean.Dog; import org.springframework.context.annotation.Import;Import(Dog.class) public class SpringConfig4 {…

CesiumJS【Basic】- #041 绘制纹理线(Entity方式)- 需要自定义着色器

文章目录 绘制纹理线(Entity方式)- 需要自定义着色器1 目标2 代码2.1 main.ts3 资源文件绘制纹理线(Entity方式)- 需要自定义着色器 1 目标 使用Entity方式绘制纹理线 2 代码 2.1 main.ts import * as Cesium from cesium;const viewer = new Cesium.Viewer

K8S学习教程(一):使用PetaExpress云服务器安装Minikube 集群题

什么是Minikube Minikube是一款工具&#xff0c;主要用于在本地运行 Kubernetes 集群。Kubernetes 开源的平台&#xff0c;用于自动化容器化应用的部署、扩展和管理&#xff0c;而Minikube 使得开发人员能够在本地机器上轻松创建一个单节点的 Kubernetes 集群&#xff0c;从而…

如何使用AI学习一门编程语言?

无论你是软件开发新手还是拥有几十年的丰富经验&#xff0c;总是需要学习新知识。TIOBE Index追踪50种最受欢迎的编程语言&#xff0c;许多生态系统为职业发展和横向转型提供了机会。鉴于现有技术具有的广度&#xff0c;抽空学习一项新技能并有效运用技能可能困难重重。 最近我…

ARCGIS python 裁剪栅格函数 arcpy.management.Clip

ARCGIS python 裁剪栅格函数 arcpy.management.Clip 1 功能 裁剪掉栅格数据集、镶嵌数据集或图像服务图层的一部分。 2 使用情况 基于模板范围提取部分栅格数据集&#xff0c;输出与模板范围相交的所有像素使用以 x 和 y 坐标的最小值和最大值确定的包络矩形或使用输出范围文…

MATLAB-振动问题:单自由度阻尼振动系统受迫振动

一、基本理论 二、MATLAB实现 单自由度阻尼振动系统受迫振动&#xff0c;MATLAB代码如下&#xff1a; clear; clc; close allA 1; psi 0; F0 10; D 20; Rm 0.5; M 1; omega 2; delta Rm / (2*M); omega0 sqrt(D / M); Omega sqrt(omega0^2 - delta^2); Zm Rm i *…

LLM大模型工程师面试经验宝典--基础版(2024.7月最新)

1.简单介绍一下大模型【LLMs】&#xff1f; 大模型&#xff1a;一般指1亿以上参数的模型&#xff0c;但是这个标准一直在升级&#xff0c;目前万亿参数以上的模型也有了。大语言模型&#xff08;Large Language Model&#xff0c;LLM&#xff09;是针对语言的大模型。 2.目前主…

基于布雷格曼偏差校正技术的全变分一维时间序列信号降噪方法(MATLAB R2018A)

信号降噪是信号处理的重要步骤之一&#xff0c;目的是提高所获得信号数据的质量&#xff0c;以达到更高的定性和定量分析精度。信号降噪能提升信号处理其他环节的性能和人们对信息识别的准确率&#xff0c;给信号处理工作提供更可靠的保证。信号降噪的难点是降低噪声的同时也会…

69. x 的平方根(简单)

69. x 的平方根 1. 题目描述2.详细题解3.代码实现3.1 Python方法一&#xff1a;逐个遍历方法二&#xff1a;二分查找 3.2 Java 1. 题目描述 题目中转&#xff1a;69. x 的平方根 2.详细题解 不能使用系统内置的函数&#xff0c;寻找某个数&#xff08;假定为x&#xff09;的…

网络请求的高效处理:C++ libmicrohttpd库详解

一、libmicrohttpd简介 libmicrohttpd是一个小型的C语言库&#xff0c;用于创建HTTP服务器和客户端。它提供了HTTP 1.1协议的完整实现&#xff0c;包括持久连接、管道化请求、虚拟主机等特性。libmicrohttpd的特点是&#xff1a; 轻量级&#xff1a;易于集成到C或C项目中。跨…

微信好友不小心拉黑了?这样操作,友谊的小船不会翻

在数字化时代&#xff0c;微信已成为我们社交生活的核心&#xff0c;它不仅连接着亲朋好友&#xff0c;更承载着我们的情感与回忆。 然而&#xff0c;情绪波动时&#xff0c;我们可能会一时冲动&#xff0c;将某些好友误送入黑名单。但别担心&#xff0c;今天&#xff0c;就让…

IMU在手语识别中的应用

近期&#xff0c;一款由美国和中国科研团队联合研发的新型的穿戴设备——SignRing&#xff0c;以其独特的IMU&#xff08;惯性测量单元&#xff09;技术&#xff0c;为聋哑人士的手语识别带来了革命性的突破。SignRing不仅极大地扩展了手语识别的词汇量&#xff0c;更提高了识别…

二维数组-----螺旋性矩阵输出

题目有点难&#xff0c;ok其实是很难。。。 观察样例输出&#xff0c;不难发现&#xff0c;螺旋数组中元素的递增轨迹为&#xff1a;右右右、下下下、左左左、上上上 简明为&#xff1a;右、下、左、上。可以设开始递增的元素1的位置为&#xff08;x&#xff0c;y)&#xff0c…

AutoHotKey自动热键(二)中文版帮助手册下载和自定义一般键盘快捷键

所有的操作其实在开发者手册中已经交待完了,所以我们要使用中文的手册来进行使用 autohotkey1.1.15中文手册下载 好了,为什么有了中文手册,这里还要进行一些具体的介绍呢,就是为了让大家少踩坑,能够快速形成生产力 这里先讲一下自定义快捷键WIN键和ALT键和CTRL键和SHIFT键的组…

智慧的网络爬虫之CSS概述

智慧的网络爬虫之CSS概述 ​ CSS 是“Cascading Style Sheet”的缩写&#xff0c;中文意思为“层叠样式表”&#xff0c;用于描述网页的表现形式。如网页元素的位置、大小、颜色等。css的主要作用是定义网页的样式。 CSS样式 1. 行内样式 行内样式&#xff1a;直接定义在 HT…