目录
一、什么是Agent
二、什么是MetaGPT【多智能体框架介绍】
三、MetaGPT的背景
一、什么是Agent
智能体 = LLM+观察+思考+行动+记忆
Agent(智能体) = 一个设置了一些目标或任务,可以迭代运行的大型语言模型。这与大型语言模型(LLM)在像ChatGPT这样的工具中“通常”的使用方式不同。在ChatGPT中,你提出一个问题并获得一个答案作为回应。而Agent拥有复杂的工作流程,模型本质上可以自我对话,而无需人类驱动每一部分的交互。
我的理解:Agent是赋予大语言模型使用工具的能力,让其不再是简单的QA问答,而是通过用户的提问,大语言模型可以自己本身去使用工具把用户的指令拆分从而更好的挖掘出大语言模型的能力;例如:
Agent爬虫:
①通过bing.search.q + query的方式,构造bing的搜索页面的url
(例如:https://www.bing.com/search?q=)
②通过requests.get获取到搜索页面的结果,使用beautifulsoup解析
③提取里面的文本然后将文本传入大语言模型,进行整理和分析。
上述就是一个智能体的实例,这分别提到Agent的工具调用能力和规划能力,在 LLM 支持的自主Agent系统中,LLM 充当Agents的大脑,并辅以几个关键组成部分:
-
规划
-
子目标和分解:Agents将大型任务分解为更小的、可管理的子目标,从而能够有效处理复杂的任务。
-
反思和完善:Agents可以对过去的行为进行自我批评和自我反思,从错误中吸取教训,并针对未来的步骤进行完善,从而提高最终结果的质量。
-
-
记忆
-
短期记忆:我认为所有的上下文学习(参见提示工程)都是利用模型的短期记忆来学习。
-
长期记忆:这为Agents提供了长时间保留和回忆(无限)信息的能力,通常是通过利用外部向量存储和快速检索来实现。
-
-
工具使用
-
Agents学习调用外部 API 来获取模型权重中缺失的额外信息(通常在预训练后很难更改),包括当前信息、代码执行能力、对专有信息源的访问等。
-
二、什么是MetaGPT【多智能体框架介绍】
MetaGPT是一个多智能体协作框架,将标准化操作(SOP) 程序编码为提示确保解决问题时采用结构化方法。要求智能体以专家形式参与协作,并按要求生成结构化的输出,例如高质量的需求文档、架构设计图和流程图等。结构化的输出对于单个智能体即是更高层次的思维链(Chain-of-Thought),对于下游角色则是语义清晰、目标明确的上下文(Context)。通过明确定义的角色分工,复杂的工作得以分解为更小、更具体的任务。从而提升了LLMs的输出质量。
①什么是SOP:
SOP是 Standard Operating Procedure三个单词中首字母的大写 ,即标准作业程序,指将某一事件的标准操作步骤和要求以统一的格式描述出来,用于指导和规范日常的工作。SOP的精髓是将细节进行量化,通俗来讲,SOP就是对某一程序中的关键控制点进行细化和量化。SOP不是一个单点任务,而是一个完整的营销、运营、服务体系构成;
②为什么要做SOP?
标准作业流程可缩短大模型对不熟练且复杂的事务所花费的学习时间。只要按照步骤指示就能避免失误与疏忽;
主要特点:
-
稳定的解决方案:借助SOP,与其他 Agents 相比,MetaGPT 已被证明可以生成更一致和正确的解决方案。
-
多样化的角色分配:为LLM分配不同角色的能力确保了解决问题的全面性。
在MetaGPT中多智能体 = 智能体+环境+SOP+评审+路由+订阅+经济
-
智能体:在单个智能体的基础上,扩展了多智能体定义。在多智能体系统中,可以由多个单智能体协同工作,每个智能体都具备独特有的LLM、观察、思考、行动和记忆。
-
环境:环境是智能体生存和互动的公共场所。智能体从环境中观察到重要信息,并发布行动的输出结果以供其他智能体使用。
-
标准流程(SOP):这些是管理智能体行动和交互的既定程序,确保系统内部的有序和高效运作。
-
评审:评审是为了解决幻觉问题。人类的幻觉实际高于大语言模型,但人类已经习惯了幻觉与错误,日常中会通过大量评审来保障复杂工作每一步的可靠性。严谨有效的评审过程能将复杂工作整体的错误率降低90%
-
路由:通信是智能体之间信息交流的过程。它对于系统内的协作、谈判和竞争至关重要。
-
订阅:需求说了一个制度改革或市场变化,所有人都应该关注/判断影响/修改计划
-
经济:这指的是多智能体环境中的价值交换系统,决定资源分配和任务优先级。
三、MetaGPT的背景
在探索大规模语言模型(LLMs)的应用上,自主智能体展现了巨大的潜力,能够增强和模拟人类工作流程。目前研究主要集中在以角色扮演形式驱动LLMs,通过多轮对话解决问题。然而,在面对更为复杂的任务时,简单地连接多个LLM可能导致解决问题的不可控性,难以满足实际需求。人类通过长期实践积累了各种领域的标准操作流程(SOPs),这些SOPs在任务分解和角色协作中发挥着关键作用。
受此启发,DeepWisdom团队在2023年6月开源了MetaGPT框架,火爆全网,并联合KAUST AI中心、厦门大学、CUHK(SZ)、南京大学、UPenn以及UCB等众多高校机构的学者进行了广泛深入的研究,为多智能体协作锚定了有效范式。MetaGPT创新性地将SOPs编码为智能体的设计规范和协议,进而实现了人类领域知识的自动嵌入。这一工作为更好地理解和模拟人类工作流程提供了新的途径,为自主智能体在各种任务中的表现和适应性带来了新的可能性。