大语言模型的应用探索AI Agent初探!

前言

大语言模型的应用之一是与大语言模型进行聊天也就是一个ChatBot,这个应用已经很广泛了。

接下来的一个应用就是AI Agent。

AI Agent是人工智能代理(Artificial Intelligence Agent)的概念,它是一种能够感知环境、进行决策和执行动作的智能实体,通常基于机器学习和人工智能技术,具备自主性和自适应性,在特定任务或领域中能够自主地进行学习和改进。一个更完整的Agent,一定是与环境充分交互的,它包括两部分——一是Agent的部分,二是环境的部分。此刻的Agent就如同物理世界中的「人类」,物理世界就是人类的「外部环境」。

image-20240708160424399

效果

今天就基于开源的大语言模型Qwen2-7B-Instruct与开源的LLM应用框架SenmanticKernel实现我们的第一个AI Agent!

入门先从一个简单的例子入手,比如叫大语言模型将字符串打印至控制台。

在ChatBox应用中,我们叫大语言模型将字符串打印至控制台,它的回答可能是这样子的:

image-20240708161150957

而在简易的AI Agent应用中,大语言模型会帮我们完成这项简单的任务。

image-20240708161449438

image-20240708161514177

又比如,我们需要从数据库中检索信息,假设需要检索的信息如下所示:

 List<Order> Orders = new List<Order>(){new Order(){Id=1,Name="iPhone15",Address="武汉"},new Order(){Id=2,Name="iPad",Address="北京"},new Order(){Id=3,Name="MacBook",Address="上海"},new Order(){Id=4,Name = "HuaWei Mate60 ",Address = "深圳"},new Order(){Id = 5,Name = "小米14",Address = "广州"}};

在ChatBox应用中,我们如果问Id为1的订单信息是什么?大语言模型是不会知道我们想干什么的,回答可能如下所示:

image-20240708162121671

而在简易的AI Agent应用中,AI回答如下:

image-20240708162335212

image-20240708162418992

实践

上一篇文章讲过,在SemanticKernel中OpenAI支持Function Call的模型与月之暗面支持Function Call的模型,只需进行简单的设置即可实现自动函数调用,但我尝试了其他开源的模型,发现做不到。

通过github了解到,其他的模型可以通过提示工程来实现本地函数调用。

什么是提示工程?

提示工程(Prompt Engineering)是一种自然语言处理(NLP)技术,主要应用于生成式AI模型,如GPT-3等。它通过精心设计输入提示(prompt),引导模型生成特定类型的输出。在提示工程中,用户可以控制模型的输出内容、风格和格式,以满足不同的应用场景需求。

提示工程的关键在于设计有效的提示,这通常需要对模型的能力和限制有深入的了解。通过调整提示的结构、语言和上下文,可以显著提高模型生成结果的质量和相关性。在实际应用中,提示工程可以用于文本生成、问答、翻译、摘要、对话系统等多个领域。

上面两个简单的AI Agent应用实现的原理是一样的,选择第二个获取订单的引用进行讲解。

实现的方法来自上一篇博客提到的项目:

Jenscaasen/UniversalLLMFunctionCaller: A planner that integrates into Semantic Kernel to enable function calling on all Chat based LLMs (Mistral, Bard, Claude, LLama etc) (github.com)

在kernel中导入插件:

public sealed class OrderPlugin
{List<Order> Orders = new List<Order>(){new Order(){Id=1,Name="iPhone15",Address="武汉"},new Order(){Id=2,Name="iPad",Address="北京"},new Order(){Id=3,Name="MacBook",Address="上海"},new Order(){Id=4,Name = "HuaWei Mate60 ",Address = "深圳"},new Order(){Id = 5,Name = "小米14",Address = "广州"}};[KernelFunction, Description("根据Id获取订单")][return: Description("获取到的订单")]public string GetOrderById([Description("订单的Id")] int id){var order = Orders.Where(x => x.Id == id).FirstOrDefault();if(order != null){return order.ToString();}else{return "找不到该Id的订单";}}
}
_kernel.ImportPluginFromType<OrderPlugin>("Order");
 UniversalLLMFunctionCaller planner = new(_kernel);string result = await planner.RunAsync(AskText);

重点在planner.RunAsync中。

导入为了实现目的内置的插件:

 // Initialize pluginsvar plugins = _kernel.Plugins;var internalPlugin = _kernel.Plugins.AddFromType<UniversalLLMFunctionCallerInternalFunctions>();

UniversalLLMFunctionCallerInternalFunctions插件如下:

    internal class UniversalLLMFunctionCallerInternalFunctions{//   [KernelFunction, Description("Call this when the workflow is done and there are no more functions to call")]//   public string Finished(//  [Description("Wrap up what was done and what the result is, be concise")] string finalmessage//)//   {//       return string.Empty;//       //no actual implementation, for internal routing only//   }[KernelFunction, Description("当工作流程完成,没有更多的函数需要调用时,调用这个函数")]public string Finished([Description("总结已完成的工作和结果,尽量简洁明了。")] string finalmessage){return string.Empty;//no actual implementation, for internal routing only}//[KernelFunction, Description("Gets the name of the spaceship of the user")]//public string GetMySpaceshipName()//{//    return "MSS3000";//}[KernelFunction, Description("获取用户飞船的名称")]public string GetMySpaceshipName(){return "嫦娥一号";}//   [KernelFunction, Description("Starts a Spaceship")]//   public void StartSpaceship(//  [Description("The name of the spaceship to start")] string ship_name//)//   {//       //no actual implementation, for internal routing only//   }[KernelFunction, Description("启动飞船")]public void StartSpaceship([Description("启动的飞船的名字")] string ship_name){//no actual implementation, for internal routing only}}
}

我将英文原版注释掉并增加了一个中文的版本。

将插件转化为文本:

// Convert plugins to text
string pluginsAsText = GetTemplatesAsTextPrompt3000(plugins);

image-20240708163921817

获取到了插件中所有本地函数的信息。

nextFunctionCall = await GetNextFunctionCallAsync(chatHistory, pluginsAsText);

让大语言模型获取下一次需要调用的函数。

在对话示例中加入一个提示,这个提示是关键!

image-20240708164508312

英文原版如下:

        private string GetLoopSystemMessage(string pluginsAsTextPrompt3000){string systemPrompt = $@"You are a computer system. You can only speak TextPrompt3000 to make the user call functions, and the user will behaveas a different computer system that answers those functions.Below, you are provided a goal that needs to be reached, as well as a list of functions that the user could use.You need to find out what the next step for the user is to reach the goal and recommend a TextPrompt3000 function call. You are also provided a list of functions that are in TextPrompt3000 Schema Format.The TextPrompt3000 Format is defined like this:{GetTextPrompt300Explanation()}##available functions##{pluginsAsTextPrompt3000}##end functions##The following rules are very important:1) you can only recommend one function and the parameters, not multiple functions2) You can only recommend a function that is in the list of available functions3) You need to give all parameters for the function. Do NOT escape special characters in the name of functions or the names of parameters (dont do aaa\_bbb, just stick to aaa_bbb)!4) Given the history, the function you recommend needs to be important to get closer towards the goal5) Do not wrap functions into each other. Stick to the list of functions, this is not a math problem. Do not use placeholders.We only need one function, the next one needed. For example, if function A() needs to be used as parameter in function B(), do NOT do B(A()). Instead,if A wasnt called allready, call A() first. The result will be used in B in a later iteration.6) Do not recommend a function that was recently called. Use the output instead. Do not use Placeholders or Functions as parameters for other functions7) Only write a Function Call, do not explain why, do not provide a reasoning. You are limited to writing a function call only!8) When all  necessary functions are called and the result was presented by the computer system, call the Finished function and present the resultIf you break any of those rules, a kitten dies. ";return systemPrompt;}

我翻译了一个中文版本并添加了使用中文回答如下:

        private string GetLoopSystemMessage(string pluginsAsTextPrompt3000){string systemPrompt = $@"你是一个计算机系统。
你只能使用TextPrompt3000指令,让用户调用对应的函数,而用户将作为另一个回答这些函数的计算机系统。
以下是您所需实现的目标,以及用户可以使用的函数列表。
您需要找出用户到达目标的下一步,并推荐一个TextPrompt3000函数调用。 
您还会得到一个TextPrompt3000 Schema格式的函数列表。
TextPrompt3000格式的定义如下所示:
{GetTextPrompt300Explanation()}
##可用函数列表开始##
{pluginsAsTextPrompt3000}
##可用函数列表结束##以下规则非常重要:
1) 你只能推荐一个函数及其参数,而不是多个函数
2) 你可以推荐的函数只存在于可用函数列表中
3) 你需要为该函数提供所有参数。不要在函数名或参数名中转义特殊字符,直接使用(如只写aaa_bbb,不要写成aaa\_bbb)
4) 你推荐的历史记录与函数需要对更接近目标有重要作用
5) 不要将函数相互嵌套。 遵循列表中的函数,这不是一个数学问题。 不要使用占位符。
我们只需要一个函数,下一个所需的函数。举个例子, 如果 function A() 需要在 function B()中当参数使用, 不要使用 B(A())。 而是,
如果A还没有被调用, 先调用 A()。返回的结果将在下一次迭代中在B中使用。
6) 不要推荐一个最近已经调用过的函数。 使用输出代替。 不要将占位符或函数作为其他函数的参数使用。
7) 只写出一个函数调用,不解释原因,不提供理由。您只能写出一个函数调用!
8) 当所有必需的函数都被调用,且计算机系统呈现了结果,调用Finished函数并展示结果。
9) 请使用中文回答。如果你违反了任何这些规定,那么会有一只小猫死去。
";return systemPrompt;}

第一次直观感受到了提示工程的魔法。

根据这个模板与对话历史询问大语言模型下一步需要执行的函数名称与参数是什么:

image-20240708164957393

大语言模型回答需要调用的函数名为GetOrderById,参数id为3,接下来验证是否可以转化为一个Function Call:

image-20240708165204124

在plugins中查找是否有同名的函数,如果有KernelArguments,进行本地函数调用:

private async Task<string> InvokePluginAsync(FunctionCall functionCall)
{List<string> args = new List<string>();foreach (var paraam in functionCall.Parameters){args.Add($"{paraam.Name} : {paraam.Value}");}Debug.WriteLine($">>invoking {functionCall.Name} with parameters {string.Join(",", args)}");// Iterate over each plugin in the kernelforeach (var plugin in _kernel.Plugins){// Check if the plugin has a function with the same name as the function callvar function = plugin.FirstOrDefault(f => f.Name == functionCall.Name);if (function != null){// Create a new context for the function callKernelArguments context = new KernelArguments();// Add the function parameters to the contextforeach (var parameter in functionCall.Parameters){context[parameter.Name] = parameter.Value;}// Invoke the functionvar result = await function.InvokeAsync(_kernel, context);Debug.WriteLine($">>Result: {result.ToString()}");return result.ToString();}}
 // Invoke the functionvar result = await function.InvokeAsync(_kernel, context);

在本例中会执行:

[KernelFunction, Description("根据Id获取订单")]
[return: Description("获取到的订单")]
public string GetOrderById(
[Description("订单的Id")] int id)
{var order = Orders.Where(x => x.Id == id).FirstOrDefault();if(order != null){return order.ToString();}else{return "找不到该Id的订单";}
}

这个函数,得到如下结果:

image-20240708165812387

大语言模型判断已经完成了任务,下一步执行

   [KernelFunction, Description("当工作流程完成,没有更多的函数需要调用时,调用这个函数")]public string Finished([Description("总结已完成的工作和结果,尽量简洁明了。")] string finalmessage
){return string.Empty;//no actual implementation, for internal routing only}

这个函数,如下所示:

image-20240708170028013

下一个调用的函数是Finished的,会跳出循环:

image-20240708170231464

返回最后的信息:

image-20240708170316368

最终的效果如下所示:

image-20240708170356146

以上就是本次分享的全部内容,尝试使用开源的大语言模型与SenmanticKernel框架结合,构建自己的简易的AI Agent,不过AI Agent的效果还不是很好,任务变复杂有可能会出错,具体学习可以看推荐的项目的源代码,作者写的还是比较清晰的。感谢硅基流动提供的平台,让我等没有硬件资源的人,也可以流畅的使用开源的大语言模型,进行大语言模型的应用探索。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/43135.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

消防认证-防火窗

一、消防认证 消防认证是指消防产品符合国家相关技术要求和标准&#xff0c;且通过了国家认证认可监督管理委员会审批&#xff0c;获得消防认证资质的认证机构颁发的证书&#xff0c;消防产品具有完好的防火功能&#xff0c;是住房和城乡建设领域验收的重要指标。 二、认证依据…

Websocket在Java中的实践——整合Rabbitmq和STOMP

大纲 Rabbitmq开启STOMP支持 服务端依赖参数参数映射类配置类逻辑处理类 测试测试页面Controller测试案例 在《Websocket在Java中的实践——STOMP通信的最小Demo》一文中&#xff0c;我们使用enableSimpleBroker启用一个内置的内存级消息代理。本文我们将使用Rabbitmq作为消息代…

【Unity2D 2022:Particle System】添加拾取粒子特效

一、创建粒子特效游戏物体 二、修改粒子系统属性 1. 基础属性 &#xff08;1&#xff09;修改发射粒子持续时间&#xff08;Duration&#xff09;为3s &#xff08;2&#xff09;取消勾选循环&#xff08;Looping&#xff09; &#xff08;2&#xff09;修改粒子存在时间&…

面试常考题---128陷阱(详细)

1.问题引入 分别引入了int和Integer变量&#xff0c;并进行比较 int b 128; int b1 128;Integer d 127; Integer d1 127;Integer e 128; Integer e1 128;System.out.println(bb1); System.out.println(dd1); System.out.println(ee1); System.out.println(e.equals(e1)…

刷题(day01)

1、leetcode485.最大连续1的个数 给定一个二进制数组 nums &#xff0c; 计算其中最大连续 1 的个数。 示例 1&#xff1a; 输入&#xff1a;nums [1,1,0,1,1,1] 输出&#xff1a;3 解释&#xff1a;开头的两位和最后的三位都是连续 1 &#xff0c;所以最大连续 1 的个数是 3.…

昇思第18天打卡|ShuffleNet图像分类

ShuffleNet网络介绍 ShuffleNetV1是旷视科技提出的一种计算高效的CNN模型&#xff0c;和MobileNet, SqueezeNet等一样主要应用在移动端&#xff0c;所以模型的设计目标就是利用有限的计算资源来达到最好的模型精度。ShuffleNetV1的设计核心是引入了两种操作&#xff1a;Pointw…

张大哥笔记:你一旦开窍,就会发现遍地都是钱

大家有没有发现&#xff0c;穷人总是追逐眼前的利益&#xff0c;总是在追着钱跑&#xff0c;却总是赚不到钱。而富人有着长远的见识&#xff0c;追着问题跑&#xff0c;最后却赚的盆满钵满。 我们听过这样一句话&#xff0c;钱不是赚来的&#xff0c;而是帮助别人解决问题后给你…

Qt/C++编写地图应用/离线地图下载/路径规划/轨迹回放/海量点/坐标转换

一、前言说明 这个地图组件写了很多年了&#xff0c;最初设计的比较粗糙&#xff0c;最开始只是为了满足项目需要&#xff0c;并没有考虑太多拓展性&#xff0c;比如最初都是按照百度地图写死在代码中&#xff0c;经过这几年大量的现场实际应用&#xff0c;以及大量的用户提出…

Django 新增数据 save()方法

1&#xff0c;添加模型 Test/app11/models.py from django.db import modelsclass Book(models.Model):title models.CharField(max_length100)author models.CharField(max_length100)publication_date models.DateField()price models.DecimalField(max_digits5, decim…

软件工程(上)

目录 软件过程模型&#xff08;软件开发模型&#xff09; 瀑布模型 原型模型 V模型 构件组装模型 螺旋模型&#xff08;原型瀑布&#xff09; 基于构件的软件工程&#xff08;CBSE&#xff09; 快速应用开发模型&#xff08;RAD&#xff09; 统一过程&#xff08;UP&a…

Linux学习看这一篇就够了,超超超牛的Linux基础入门

引言 小伙伴们&#xff0c;不管是学习c还是学习其他语言在我们学的路上都绕不过操作系统&#xff0c;而且&#xff0c;老生常谈的Linux更是每个计算机人的必修&#xff0c;那么我们对Linux的了解可能只是从别人那听到的简单的这个系统很牛&#xff0c;巴拉巴拉的&#xff0c;但…

小米rdemi红米ax3000t刷机 20240707最新配套完整程序整理合集

小米rdemi红米ax3000t刷机程序地址&#xff1a; https://www.123pan.com/s/LA1bVv-EOzVv.html 小米路由器SSH密码计算器 https://www.1234f.com/fuwu/ax3000t/ 最新更新地址&#xff1a;https://www.1234f.com/fuwu/openwrt/ 依次输入如下命令&#xff1a; curl -X POST h…

Leetcode 295.数据流的中位数

295.数据流的中位数 问题描述 中位数是有序整数列表中的中间值。如果列表的大小是偶数&#xff0c;则没有中间值&#xff0c;中位数是两个中间值的平均值。 例如 arr [2,3,4] 的中位数是 3 。例如 arr [2,3] 的中位数是 (2 3) / 2 2.5 。 实现 MedianFinder 类: Media…

算法013:水果成篮

水果成篮. - 备战技术面试&#xff1f;力扣提供海量技术面试资源&#xff0c;帮助你高效提升编程技能,轻松拿下世界 IT 名企 Dream Offer。https://leetcode.cn/problems/fruit-into-baskets/ 这道题题目很长&#xff0c;仔细阅读过后&#xff0c;我们其实可以简化成&#xff…

聚焦数字创新,定义影像未来

国际数字影像产业园在明确产业定位与发展方向时&#xff0c;应聚焦于数字影像、文创、媒体等新兴产业领域&#xff0c;以技术创新为核心动力、产业升级为保障、市场拓展为途径、国际化发展为方向&#xff0c;推动园区的持续健康发展。 作为园区的核心产业&#xff0c;数字影像产…

第二证券股市知识:股票填权是怎么回事?利好还是利空?

1、股票填权的含义 股票填权是指在除权除息之后的一段时刻内&#xff0c;假设多数投资者看好该个股&#xff0c;股票的价格超过除权除息的基准价就叫做填权。上市公司假设能持续分红&#xff0c;就会向市场传递积极信号&#xff0c;招引更多投资者买入&#xff0c;越来越多的投…

使用Livox-Mid360激光雷达,复现FAST_LIO(保姆级教程)

前面我已经完成了mid360激光雷达的驱动安装&#xff0c;octomap的复现&#xff0c;昨天我去把这俩在正式环境中实测了一下&#xff0c;效果不好&#xff0c;走廊转角没建出来&#xff0c;我查了一下&#xff0c;应该是TF的原因&#xff0c;但这部分我还不太懂&#xff0c;看到有…

云计算【第一阶段(28)】DNS域名解析服务

一、DNS解析的定义与作用 1.1、DNS解析的定义 DNS解析&#xff08;Domain Name System Resolution&#xff09;是互联网服务中的一个核心环节&#xff0c;它负责将用户容易记住的域名转换成网络设备能够识别和使用的IP地址。一般来讲域名比 IP 地址更加的有含义、也更容易记住…

2024世界人工智能大会:deepin引领AI与操作系统融合新时代

内容来源&#xff1a;deepin&#xff08;深度&#xff09;社区 7月4日&#xff0c;WAIC 2024在上海拉开帷幕。大会围绕核心技术、智能终端、应用赋能三大板块&#xff0c;聚焦大模型、算力、机器人、自动驾驶等重点领域&#xff0c;集中展示一批“人工智能”创新应用最新成果。…