翻译: LLM工具使用和代理Tool use and agents

在这里插入图片描述
欢迎来到本周的最后一个视频。在这个视频中,我想与您分享LLM(大型语言模型)开始能够使用工具的情况,以及讨论一下前沿的“代理”主题,这是让LLM自己决定下一步采取什么行动的领域。让我们来看看。在早期的食物订单接收聊天机器人示例中,我们看到如果您说“给我送个汉堡”,机器人可能回复“好的,正在路上”。

为了让聊天机器人输入订单并将其发送给您,这是幕后实际发生的事情。LLM不能仅仅说“好的,正在路上”,因为它需要采取一些行动来真正将汉堡送到您手中。因此,LLM可能会输出这样的回应:“为用户9876订购汉堡,送到这个地址”,然后还说用户消息是“好的,正在路上”。经过微调的LLM能够生成这样的订单,这种情况下将触发一个软件应用程序,向餐厅订购系统发出请求,将汉堡送到该用户的地址。用户看到的不是完整的LLM输出。这里的完整LLM输出是全部四行文本,但只有最后一行“好的,正在路上”被发送给用户作为回应。所以,这是LLM使用的工具的一个例子,其中LLM输出的文本可以触发调用软件系统来下达餐厅订单。

在这里插入图片描述
现在,下达错误订单可能是一个代价高昂的错误。因此,可能更好的用户界面是,在最终确定订单之前弹出一个验证对话框,让用户确认订单是否正确,然后在扣款并发送给他们之前再次确认。显然,鉴于LLM的输出并不完全可靠,对于任何安全关键或任务关键的操作,在让LLM自行触发可能造成代价高昂的错误之前,让用户确认所需操作是一个好主意。
在这里插入图片描述

除了用于采取行动的工具外,工具还可用于推理。例如,如果您提示LLM,“如果我将100美元存入银行账户,该账户支付5%的利息,那么8年后我将获得多少钱?”LLM可能会生成像这样的答案,听起来似乎是合理的,但147.74美元并不是正确的答案。事实证明,LLM在经过预测下一个词或指令调整的学习后,并不擅长精确计算。就像UI可能会使用计算器来计算类似问题的正确答案一样,我们也可以给LLM一个计算器工具来帮助它得到正确的答案。
在这里插入图片描述

因此,与其让LLM直接输出答案,不如让LLM输出这样的内容:“复利计算后等于,计算器计算100乘以1.05(即5%的利率)的8次方。”这可以解释为命令,调用外部计算器程序来明确计算正确的答案,即147.74美元,并将其反馈到文本中,以便为用户提供正确的金额。通过给LLM提供调用工具的能力,我们可以显著扩展LLM的推理或采取行动的能力。

工具的使用今天是许多LLM应用的重要部分,当然,这些应用的设计者应该小心确保工具不会以可能造成伤害或不可逆转的损害的方式被触发。
在这里插入图片描述

除了工具之外,进入更多实验性领域,AI研究人员一直在研究代理(agents),它们不仅仅触发工具来执行单一动作,而是探索是否可以选择并执行复杂的动作序列。关于代理的研究充满了兴奋和挑战,但这仍处于AI研究的前沿。它还不够成熟,不能用于大多数重要应用。但我想与您分享许多AI社区成员所兴奋的事情。如果您要求一个基于LLM构建的代理帮助您研究更好的汉堡店的主要竞争对手,那么代理可能会使用LLM作为推理引擎,来确定它需要执行哪些步骤来完成您的研究任务。

  1. 这个推理引擎LLM可能会决定需要搜索竞争对手的名单,
  2. 然后访问每个竞争对手的网站,
  3. 最后,针对每个竞争对手,根据主页内容撰写摘要。

然后,通过对这个推理引擎的一系列调用,它可能会发现为了搜索主要竞争对手,它必须触发工具来调用网络搜索引擎,并查询“BetterBurger的竞争对手”。之后,它可能会访问一些主要竞争对手的网站来下载他们的主页。然后再次调用LLM来总结他们在网站上找到的文本。

虽然互联网上已经有一些不错的代理演示,但这项技术还没有真正准备好进入主流应用。但也许在未来,随着研究人员使其变得更好,它将变得更有用。如果LLM作为推理引擎可以帮助决定采取哪些安全和负责任的步骤来帮助用户完成任务,我认为这将是一个令人兴奋的未来。

感谢您坚持观看至第二周的最后。我们的课程还有最后一周。下周,我们将探讨生成型AI如何影响公司,包括您如何为您的业务提出生成型AI用例,以及探讨生成型AI如何影响社会及其对就业的影响。期待下周与您相见。

参考

https://www.coursera.org/learn/generative-ai-for-everyone/lecture/pOwXb/tool-use-and-agents-optional

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/226232.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【C 剑指offer】有序整型矩阵元素查找 {杨氏矩阵}

目录 题目内容: 思路: 图形演示: 复杂度分析 C源码: /** *************************************************************************** ******************** ********************* ******…

遥感论文 | Scientific Reports | 一种显著提升遥感影像小目标检测的网络!

论文题目:MwdpNet: towards improving the recognition accuracy of tiny targets in high-resolution remote sensing image论文网址:https://www.nature.com/articles/s41598-023-41021-8 摘要 提出MwdpNet,以提高对高分辨率遥感&#xf…

connect: Network is unreachable问题解决

第一步:查看ifcfg-ens33配置文件 cd /etc/sysconfig/network-scripts/ cat ifcfg-ens33 发现问题:GATEWAY写错成GATWAY 第二步:修改 vim ifcfg-ens33 第三步:检测是否成功 ping baidu.com 成功!

Mysql 的ROW_NUMBER() 和分区函数的使用 PARTITION BY的使用

Mysql 的ROW_NUMBER() 和分区函数的使用 PARTITION BY的使用 描述: 遇到了一个需求,需要查询用户id和计划id,但是人员id的是重复,我想把人员id去重,支取一个。自然而然的就想到了 SELECT DISTINCT prj_plan.last_mon…

分布式事务--初识Seata和TC部署

1.Seata介绍 Seata是 2019 年 1 月份蚂蚁金服和阿里巴巴共同开源的分布式事务解决方案。致力于提供高性能和简单易用的分布式事务服务,为用户打造一站式的分布式解决方案。 官网地址:Seata | Seata,其中的文档、播客中提供了大量的使用说明…

Python读写arxml文件

文章目录 前言一、XML简介二、XML文件结构三、Python读取xml文件安装ElementTree库读取xml文件四、Python写入xml文件前言 本文主要通过介绍arxml文件,为后续python脚本开发奠定基础。 arxml是AUTOSAR XML的简称,是一个通用的配置/数据库文件,实质是一个xml文件。 ①更规范…

Mysql查询条件为大于时,不走索引失效场景

如下 where a>1 and b2 是不走索引。 因为a>1 , (这里说的是,a是走了索引,但是b没有走,为什么了?因为b只有在a相同时,b才有序,也就是说这个联合索引只用到了一半)的数据是无序的(1 4 1 2)&#xff0…

WGAN 优势小结

我在上一篇博文为什么 GAN 不好训练中,分析了原始 GAN 难以训练的原因,本篇博文将分析下 WGAN 的优势。 1. Wasserstein 距离 W 是指 Wasserstein,Wasserstein 距离又叫Earth-Mover(EM)距离。Wasserstein距离相比KL散…

ubuntu18.04 安装yolov5环境及推理环境

文章目录 1、安装anaconda31.2、环境变量配置1.3、添加/更换 conda 清华源 2、安装pytorch1.63、CUDA安装4、安装cuDNN5、安装tensorRT6、安装opencv4.67、tensorRT部署yolov5模型推理 1、安装anaconda3 官方网网址 https://www.anaconda.com/download#downloads去到下载的文…

心理测试网站源码,知己心理React心理健康测试

源码介绍 React心理健康测试网站源码,帮助需要的人更好地了解自已的心理健康状态和人格特征。 React可以在Vite中启用HMR,并且包含了几人EsLint规则。只需要使用react antd-mobile即可 轻松部署完成。

千梦网创:逮住一闪而过的机会疯狂摩擦

我这个人平时想的就多,睡觉也在想事情,有时候睡觉里想的事情往往都是很纯粹的、很绝妙的,但是经常性一醒过来就忘了,再去回忆怎么也想不起来了。 灵感只在特定的环境下产生,这类环境是不可再生和模拟的。 机会只因特…

【C++11特性篇】盘点C++11中三种简化声明的方式【auto】【decltype】【nullptr】(3)

前言 大家好吖,欢迎来到 YY 滴C系列 ,热烈欢迎! 本章主要内容面向接触过C的老铁 主要内容含: 欢迎订阅 YY滴C专栏!更多干货持续更新!以下是传送门! 目录 一.auto&范围for二.decltyp…

用Python快速从深层嵌套 JSON 中找到特定的 Value

有时候,我们拿到一个JSON数据的时候,会难以看出其逻辑层次结构。 这时候就需要我们进行代码解析了。 代码: import jsondef find_json_value(data_json, value, path""):if isinstance(data_json, dict):for k, v in data_json.…

Web 应用程序性能测试核心步骤

通常大家做web 应用程序的时候会有哪些操作呢?今天就来看看常见的web 应用程序的常见操作。 Web 应用程序性能测试核心步骤 1:识别测试环境。确定物理测试环境和生产环境,以及测试团队可用的工具和资源。物理环境包括硬件、软件和网络配置。…

c语言单向链表

看如下代码,这是一个完整的可运行的c源文件,要注意的点: c语言程序运行不一定需要头文件NULL其实是 (void*)0,把指针赋值成(void*)0,就是防止程序员不想该指针被引用的时候被引用,引用地址为0的值程序会引起系统中断&…

PyQt6 QSpacerItem弹簧控件

锋哥原创的PyQt6视频教程: 2024版 PyQt6 Python桌面开发 视频教程(无废话版) 玩命更新中~_哔哩哔哩_bilibili2024版 PyQt6 Python桌面开发 视频教程(无废话版) 玩命更新中~共计46条视频,包括:2024版 PyQt6 Python桌面开发 视频教程(无废话版…

00后卷王的自述,我难道真的很卷?

前言 前段时间去面试了一个公司,成功拿到了offer,薪资也从12k涨到了18k,对于工作都还没两年的我来说,还是比较满意的,毕竟一些工作3、4年的可能还没我高。 我可能就是大家说的卷王,感觉自己年轻&#xff…

自动化访客互动:提升网站效益与用户体验的关键优势

在激烈的市场竞争环境中,想抢占市场,获得收益并不容易。每一个订单的完成都要经过一定的销售周期,所以企业可以根据销售周期每个阶段的特点进行优化,留住客户。其中,企业可以在与客户在线互动的过程中,让互…

ShardingSphere-JDBC 和 ShardingSphere-Proxy,你选择哪一个

参考文章 总结: 只使用Java,ShardingSphere-JDBC更好有异构语言的话,ShardingSphere-Proxy 更好混用也挺香

小红书商品详情API:电商助力

一、引言 随着互联网的普及和电商行业的快速发展,消费者对于商品信息的获取方式也在不断变化。小红书作为一款以内容分享为主的社交电商平台,吸引了大量用户。为了满足用户对商品信息的快速获取需求,小红书提供了商品详情API接口。本文将探讨…