一、Agents概念
人类是这个星球上最强大的 Agent。Agent是一个能感知并自主地采取行动的实体,这里的自主性极其关键,Agent要能够实现设定的目标,其中包括具备学习和获取知识的能力以提高自身性能。
关键点:感知环境、自主决策、具备行动能力,设定明确的目标和任务,适应环境及学习能力
例如 Agent 的复杂程度各不相同,一个简单的恒温器可以是一个 Agent
一个大型的国家或者一个生物群体也可能是个 Agent。
垂直领域 Agent :
比如 Alphago,还有使用强化学习打游戏的DeepMind的Agent57,更加通用的Gato,OpenAI玩“躲猫猫”的多智能体。
二、prompt 工程
提示词万能公式
角色+角色技能+
任务核心关键词+任务目标+任务背景+任务范围+任务解决与否判定+任务限制条件
输出格式/形式+输出量
https://github.com/JushBJJ/Mr.-Ranedeer-AI-Tutor
三、Prompt外挂
外挂知识库数据库
这些还不够,尝试让 GPT 调用函数和使用工具,ChatGPT也推出了插件体系。当人们发现大模型的推理能力很差时,开始试图让模型自身清楚地描述问题,把问题转化为 PDDL (Planning Domain Definition Language)格式的描述语言,通过调用通用规划器来解决规划问题 。
四、分解与组合
大模型在大任务执行能力上分解和组合。例如,
1.MapReduce 模式
将一个大型文本进行摘要,分开摘要在获得整体摘要
2、思维链(Chain of Thought,CoT),
它要求模型展示其思考过程
两种方式实现,一种是具体说明,即要求模型详细地、一步步地思考;
另一种是示例说明,即通过给定问题和答案的同时,提供思考过程。当询问模型时,模型会模仿此过程,逐渐思考并给出答案。
尝试多种思路来解决问题,然后投票选择最佳答案,这就是CoT-SC
3、思维树(ToT, Tree of Thought)
发散的方法也有局限性,例如24点问题,它不能很好地解决,解决方法垂直分解,思维树(ToT, Tree of Thought)的一个主要思路,它会根据当前的问题分解出多个可能,然后每一个树节点就是父节点的一个子问题,逐层扩散,遍布整个解空间,一些节点就直接会发现不合适而终止掉,达到了有效剪枝的作用。
比如排序问题,排序你可能需要分解和排序,然后再merge,COT就不行了
4、Graph of Tree,GoT
为了解决这个问题,一种名为思维图(Graph of Tree,GoT)的方法被提出。这种思维图既可以分解,也可以合并。
2023年9月26日,清华姚期智团队又提出了更新的方法——累计推理
首先会提出一个初步的想法,然后再对这个想法进行验证,看这个提案是否合适。如果提案合适,就将它添加到图的下一个节点,每一步都基于已经建立的图节点进行下一个思考节点的创建,这样发散、合并或删除直到达到最终目标状态,完备性和灵活性大大增强。24点问题上成功率已经达到98%
4、反馈
分解和组合,不能与外界进行互动,反馈是整个控制论的基石,也是动物体从诞生之初就具备的基本能力。
ReACT让大模型先进行思考,思考完再进行行动,然后根据行动的结果再进行观察,再进行思考,这样一步一步循环下去。基本上就是人类这样的智能体主要模式。
Agent的框架都会让模型输出JSON进行函数调用,OpenAI也就推出了Funtion Calling
五、Agents
1、AutoGPT
AutoGPT横空出世,短短数周Star数就超过PyTorch达到90k
创建一个初始的计划,然后进入主循环。系统会让模型判断在当前计划下该进行何种行动,接着会执行行动。执行完毕后,结果会写入下一次循环中。如此,每次决策都会基于之前的结果、记忆和计划,从而制定出新的行动方案。
2、jarvis gpt
微软的贾维斯 (Jarvis)一个深度学习任务调度系统,也采用了类似思想。他们主要关注如何调用模型来执行各种深度学习任务,涉及到了先做计划,再选择模型,然后执行任务,获取反馈,然后进入下一轮循环等环节。
3、Xagents
清华联合面壁发布了XAgent,提出了双循环机制在效果上碾压了AutoGPT
GPT-4也是一种Agent,Agent的概念是大模型的超集
1.6 Multi-Agent
斯坦福小镇"开了一个好头。在这个虚拟的小镇里,每个角色都是一个单独的智能体,每天依据制定的计划按照设定的角色去活动和做事情,
MetaGPT的项目
引起了广泛关注,这个项目中定义了产品经理、架构师、项目管理员、工程师和质量保证等角色,各角色之间通过相互协作,基本可以胜任完成500行左右代码的小工程了。
ChatDev的系统
清华开发了一个名为ChatDev的系统,进一步引入了CEO等角色,这里就不再展开描述。
RPA Agents
RPA 公司实在智能把 Agent 用于他们的产品调用常见桌面软件,如淘宝网、钉钉,来自动完成桌面任务。
Agent 的实现,共性:长短时记忆能力、工具使用能力、通信能力,甚至包括 SOP 的能力
AI在一定程度上模仿了人脑的工作方式,但实际上,机器人和人脑在处理信息时采用的策略有很大的不同。因此,即使在未来,我们也需要继续改进 AI 框架,以解决这种差距。比如一个百万位数的加法任务,GPT-4囿于token数的限制是不可能完成这个任务的,但人类却可以,这恰是人类和AI需要弥补的Gap。
五、智能本质