AI代理架构的发展:从单一到多代理系统的演进及其影响分析

  每周跟踪AI热点新闻动向和震撼发展 想要探索生成式人工智能的前沿进展吗?订阅我们的简报,深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同,从行业内部的深度分析和实用指南中受益。不要错过这个机会,成为AI领域的领跑者。点击订阅,与未来同行! 订阅:https://rengongzhineng.io/

代理人的转变


自从ChatGPT推出以来,初代的生成性AI应用主要围绕着使用检索增强生成(RAG)模式的聊天机器人,以响应用户提示。尽管有持续的工作来增强这些基于RAG的系统的健壮性,研究社区现在正在探索下一代AI应用 —— 其中一个共同的主题是发展自主AI代理人。

代理系统整合了如规划、迭代和反思等高级能力,这些能力利用模型固有的推理能力来完成端到端的任务。配合使用工具、插件和函数调用的能力 —— 代理能够处理更广泛的通用工作。

代理人的推理、规划和有效工具调用的重要性


推理是人类思维的基础构件。没有推理,人们无法做决策、解决问题或在学到新信息时完善计划 —— 本质上是误解了我们周围的世界。如果代理人没有强大的推理技能,他们可能会误解其任务,生成无意义的答案,或未能考虑多步骤的影响。

我们发现大多数代理实现包含一个规划阶段,该阶段采用以下技术之一来创建计划:任务分解、多计划选择、外部模块辅助规划、反思和完善以及记忆增强规划。

相较于仅使用基础语言模型,利用代理实现的另一个好处是,代理人可以通过调用工具解决复杂问题。工具可以使代理执行诸如与API交互、写入第三方应用程序等操作。推理和工具调用紧密相连,有效的工具调用依赖于充分的推理。简而言之,不能期望一个推理能力差的代理人知道何时是调用其工具的合适时机。

单一代理与多代理架构


研究强调,无论是单一代理还是多代理架构,都可以通过采用推理和工具调用步骤来解决具有挑战性的任务。

对于单一代理实现,我们发现成功的目标执行依赖于适当的规划和自我修正。如果没有自我评估和创建有效计划的能力,单一代理可能会陷入无休止的执行循环,永远无法完成既定任务或返回不符合用户期望的结果。我们发现,当任务需要直接函数调用且不需要来自另一代理的反馈时,单一代理架构特别有用。

然而,我们注意到单一代理模式通常难以完成一长串子任务或工具调用。多代理模式可以解决并行任务和鲁棒性问题,因为架构中的多个代理可以分别处理各个子问题。许多多代理模式首先将复杂问题分解为若干个较小的任务。然后,每个代理使用其独立的工具集独立解决各个任务。

涉及多个代理的架构提供了基于能力进行智能劳动分配的机会,以及来自不同代理人格的宝贵反馈。许多多代理架构在规划、执行和评估阶段以阶段方式运作,其中代理团队被动态

组建和重组。这种重组因为利用了专门的代理来完成特定任务,并在不再需要时将其移除,从而产生了优越的结果。通过匹配代理角色和技能以适应手头的任务,代理团队可以提高准确性并缩短完成目标所需的时间。有效的多代理架构的关键特性包括在代理团队中明确的领导、动态团队构建和团队成员之间的有效信息分享,以防重要信息在无关紧要的通信中丢失。

研究突出了诸如ReAct、RAISE、Reflexion、AutoGPT + P、LATS以及多代理实现如DyLAN、AgentVerse和MetaGPT等著名的单一代理方法,这些在全文中有更深入的解释。

我们的关键发现


单一代理模式:

单一代理模式通常最适合工具列表明确且流程明确定义的任务。它们不会受到来自其他代理的不良反馈或来自其他团队成员的分散和无关的闲聊的影响。然而,如果单一代理的推理和完善能力不健全,它们可能会陷入执行循环,并且无法朝着其目标取得进展。

多代理模式:

多代理模式非常适合需要来自多个人格的反馈以完成任务的情况。当需要跨不同任务或工作流的并行处理时,它们很有用,允许各个代理继续进行下一步操作,而不受其他代理处理的任务状态的影响。

反馈和人在循环中

语言模型倾向于在其响应中更早地承诺一个答案,这可能导致与其目标状态日益偏离的“滚雪球效应”。通过实施反馈,代理更有可能纠正其路径并达到其目标。人类的监督通过使代理的回应更贴近人类的期望,改善了即时结果,产生了更可靠和更值得信赖的结果。代理可能会受到来自其他代理的反馈的影响,即使这些反馈并不可靠。这可能会导致代理团队产生一个错误的计划,使他们偏离目标。

信息共享和沟通

多代理模式更倾向于陷入礼节性的交流,代理们可能会互相询问诸如“你好吗”,而单一代理模式则倾向于专注于手头的任务,因为没有团队动态需要管理。这可以通过强有力的提示来减轻。在垂直架构中,代理可能会失败于将关键信息发送给他们的支持代理,没有意识到其他代理不知道完成其任务所需的必要信息。这种失败可能导致团队混乱或结果出现幻觉。解决这个问题的一种方法是在系统提示中明确包括关于访问权的信息,以便代理进行上下文适当的交互。

角色定义和动态团队的影响

对于单一代理和多代理架构而言,清晰的角色定义都至关重要。角色定义确保代理理解其指派的角色,专注于提供的任务,执行适当的工具,并最小化其他能力的幻觉。建立明确的团队领导可以提高多代理团队的整体表现,通过简化任务

分配。动态团队,根据需要将代理引入和移出系统,也被证明是有效的。这确保参与任务的所有代理都是强有力的贡献者。

关键见解摘要

讨论的关键见解表明,最佳的代理架构根据用例的不同而有所不同。无论选择哪种架构,表现最好的代理系统倾向于至少采用以下一种方法:明确定义的系统提示、清晰的领导和任务分配、专门的推理/规划-执行—评估阶段、动态团队结构、人类或代理反馈以及智能信息过滤。利用这些技术的架构在各种基准和问题类型中更为有效。

结论


我们的元分析旨在提供对当前AI代理景观的全面理解,并为那些使用现有代理架构或开发自定义代理架构的人提供洞见。在自主AI代理的设计和开发中存在显著的限制和未来改进的领域,例如缺乏全面的代理基准、现实世界的适用性以及减轻有害语言模型偏见的措施。这些领域将需要在近期内得到解决,以实现可靠的代理。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/6335.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

数据结构与算法---线性表

线性表 1.顺序表 需求分析 /*创建顺序表具体功能:初始化顺序表销毁顺序表获取顺序表元素个数输出顺序表中的内容自动扩容增 --- 插入数据(包含了尾部添加功能)删 --- 删除数据(包含了尾部删除功能)改 --- 修改数据查…

Android使用kts上传aar到JitPack仓库

Android使用kts上传aar到JitPack 之前做过sdk开发,需要将仓库上传到maven、JitPack或JCenter,但是JCenter已停止维护,本文是讲解上传到JitPack的方式,使用KTS语法,记录使用过程中遇到的一些坑. 1.创建项目(library方式) 由于之前用鸿神的w…

外网禅道配置

exportfs -avrf 修改代码,避免启动太慢:vi /opt/zbox/bin/zbox.php 启动和停止 /opt/zbox/zbox start /opt/zbox/zbox stop

YOLOv5手势物体识别(附代码)

之前是做的yolov3手势物体识别,最近几天我将该项目进行了重新的整理和升级,实现了yolov5手势物体识别,同时为了方便更多的人直接拿来应用,我生成了支持windows系统的应用小程序,即便你电脑上没有安装pytorch,没有安装c…

4 Spring AOP

目录 AOP 简介 传统开发模式 先来看一个需求 解决方案 AOP 图示 Spring 启用 AspectJ 基于 xml 配置 创建 pom.xml 创建 UserService 借口和 UserServiceImpl实现类 创建 LogAdvice 日志通知 创建 log4j.properties 重点:创建 spring-context-xml.xml 配…

MYSQL从入门到精通(二)

1、MYSQL高级概述 【1】架构概述 【2】索引优化 【3】查询截取 【4】mysql锁机制 【5】主从复制 2、MYSQL概述 【1】mysql内核 【2】sql优化工程师 【3】mysql服务器的优化 【4】各种参数常量设定 【5】查询语句优化 【6】主从复制 【7】软硬件升级 【8】容灾百分 【9】sql编…

使用Neo4j和Langchain创建知识图谱

使用Neo4j和Langchain创建知识图谱 知识图谱是组织和整合信息的强大工具。通过使用实体作为节点和关系作为边缘,它们提供了一种系统的知识表示方法。这种有条理的表示有利于简化查询、分析和推理,使知识图在搜索引擎、推荐系统、自然语言处理和人工智能…

从0开始学习制作一个微信小程序 学习部分(6)组件与事件绑定

系列文章目录 学习篇第一篇我们讲了编译器下载,项目、环境建立、文件说明与简单操作:第一篇链接 第二、三篇分析了几个重要的配置json文件,是用于对小程序进行的切换页面、改变图标、控制是否能被搜索到等的操作第二篇链接、第三篇链接 第四…

Windows设置Redis为开机自启动

前言 Redis作为当前最常用的当前缓存技术,基本上Web应用中都有使用。所以,每次我们在本地启动项目前,都必须将Redis服务端启动,否则项目就会启动失败。但是,每次都要去启动Redis就很麻烦,有没有办法做到开…

Python爬虫--爬取糗事百科段子

爬取糗事百科段子&#xff1a; 段子在 <div class"content"> 里面的 <span> 标签里面 不过这里有个坑&#xff0c;div 标签跟 span 标签 之间有很多空行 普通 .*? 是匹配不了的&#xff0c;需要使用模式修饰符 S S 的意思 让 .(点) 匹配&#xff0c…

吴恩达2022机器学习专项课程(一)正则化(正则化成本函数正则化线性回归正则化逻辑回归)

目录 一.正则化1.1 正则化的好处1.2 正则化的实现方式 二.正则化改进线性回归的成本函数2.1 正则化后的成本函数的意义2.2 λ参数的作用2.3 不同λ对算法的影响2.4 为什么参数b没有正则化项 三.正则化线性回归的梯度下降3.1 为什么正则化可以在梯度下降迭代中减小w3.2 导数的计…

机器学习笔记-18

异常检测问题 异常检测虽然主要用于无监督学习问题上&#xff0c;但是和监督学习问题很相似。 异常检测(Anomaly Detection)&#xff1a;给定正确样本集{ x ( 1 ) , x ( 2 ) . . . x ( n ) x^{(1)},x^{(2)}...x^{(n)} x(1),x(2)...x(n)}&#xff0c;记新样本即要检测的样本为…

eNSP-抓包解析HTTP、FTP、DNS协议

一、环境搭建 1.http服务器搭建 2.FTP服务器搭建 3.DNS服务器搭建 二、抓包 三、http协议 1.HTTP协议&#xff0c;建立在FTP协议之上 2.http请求 3.http响应 请求响应报文参考&#xff1a;https://it-chengzi.blog.csdn.net/article/details/113809803 4.浏览器开发者工具抓包…

002-ChatGLM4接入Langchain

智谱AI GLM-4 新一代基座大模型GLM-4,整体性能相比GLM3全面提升60%,逼近GPT-4;支持更长上下文;更强的多模态;支持更快推理速度,更多并发,大大降低推理成本;同时GLM-4增强了智能体能力。 基础能力(英文):GLM-4 在 MMLU、GSM8K、MATH、BBH、HellaSwag、HumanEval等…

ubuntu搭建jupyter_notebook服务器

环境&#xff1a;ubuntu 22.04 目录 环境&#xff1a;ubuntu 22.04 一、创建一个anaconda用户 创建用户condaUser 为用户condaUser设置密码 开放opt文件夹的权限 登录condaUser用户 二、安装anaconda 下载anaconda 安装anaconda 三、添加环境变量 四、anaconda换源 …

【Unity Shader入门精要 第4章】数学基础(二)

1. Unity中的坐标空间 1.1 五个坐标空间 模型空间 模型自身的3D坐标系空间&#xff0c;左手坐标系是一个相对空间&#xff0c;坐标轴指向随模型旋转变化当物体有父节点时&#xff0c;Transform组件中各属性的值表示的即为该物体在其父物体的模型空间中的值当模型顶点传入顶点…

ARP防火墙能够为网络安全贡献什么样的力量

ARP防火墙&#xff08;Address Resolution Protocol Firewall&#xff09;作为网络安全的一环&#xff0c;起到保护网络免受ARP欺骗攻击的关键作用。今天德迅云安全给您介绍ARP防火墙的相关方面&#xff0c;帮助您深入了解和认识这一关键的安全措施。 网络安全对于现代社会的信…

「 网络安全常用术语解读 」SBOM主流格式CycloneDX详解

CycloneDX是软件供应链的现代标准。CycloneDX物料清单&#xff08;BOM&#xff09;可以表示软件、硬件、服务和其他类型资产的全栈库存。该规范由OWASP基金会发起并领导&#xff0c;由Ecma International标准化&#xff0c;并得到全球信息安全界的支持&#xff0c;如今CycloneD…

Java——认识异常

目录 一.异常的概念与体系结构 1.异常的概念 1.1算术异常 1.2数组越界异常 1.3空指针异常 2.异常的体系结构 3.异常的分类 3.1编译时异常 3.2运行时异常 二.异常的处理 1.防御式编程 1.1LBYL 1.2EAFP&#xff08;核心&#xff09; 2.异常的抛出 3.异常的捕获 3…

使用 ORPO 微调 Llama 3

原文地址&#xff1a;https://towardsdatascience.com/fine-tune-llama-3-with-orpo-56cfab2f9ada 更便宜、更快的统一微调技术 2024 年 4 月 19 日 ORPO 是一种新的令人兴奋的微调技术&#xff0c;它将传统的监督微调和偏好校准阶段合并为一个过程。这减少了训练所需的计算…