o1快慢思考的风又吹到了Agent!

智能体(Agent)通过自然对话与用户互动有两个任务:交谈和规划/推理。对话回应必须基于所有可用信息,行动必须有助于实现目标。与用户交谈和进行多步推理和规划之间的二分法,类似卡尼曼引入的人类快速思考慢速思考系统。

为此,Google DeepMind提出了一个名为Talker-Reasoner的双系统架构,以模拟人类的两种思考系统。

图片

Talker-Reasoner的双系统架构,用于构建能够通过自然对话与用户互动的智能代理。这种架构受到人类“快速思考”和“慢速思考”系统的启发,将Agent分为两个部分:快速直观的“Talker”(系统1)慢速、深思熟虑的“Reasoner”(系统2)

双系统Talker-Reasoner方法的示意图

图片

Talker-Reasoner智能体模型

详细介绍了提出的双系统Talker-Reasoner智能体模型,该模型受到人类快速思考(System 1)和慢速思考(System 2)的启发。这个模型将智能体分为两个独立的但相互协作的组件:

Talker-Reasoner架构的图表

图片

  1. Talker智能体(System 1):这个智能体是快速、直观的,负责与用户进行自然语言交流,生成对话回应。它类似于人类的直觉反应,能够迅速地从记忆中获取信息,以支持其回应。Talker智能体在每次与用户互动时都会激活,并且可以访问记忆来引导其回应,类似于System 1的持续激活。

  2. Reasoner智能体(System 2):这个智能体是慢速、深思熟虑且逻辑性强的,负责执行复杂的多步推理和规划。它调用工具、执行动作,并更新智能体的状态。Reasoner智能体还负责形成和更新关于用户的信念状态,这些信念状态以结构化的语言对象形式存储在记忆中。

这两个智能体之间的主要交互方式是通过记忆。Reasoner智能体负责生成新的信念状态和推导多步推理和规划,并将它们存储在记忆中。Talker智能体在需要信念时,会从记忆中检索最新的状态。因此,Talker智能体可能会使用延迟的世界视图进行操作,因为Reasoner智能体可能还没有时间生成新的信念并将其存储在记忆中。

此外,Talker智能体还可以选择等待Reasoner智能体完成其推理过程,然后再生成回应。这种设计允许快速印象和回应的Talker智能体成为Reasoner智能体明确信念和选择(计划)的来源。这种分工方式在大多数情况下都能很好地工作,因为Talker智能体通常非常擅长其任务:它可以自动从记忆中获取信息,有效地引导其底层模型以很好地应对熟悉情况。

睡眠辅导智能体案例研究

通过一个睡眠辅导智能体的案例研究来评估和实例化Talker-Reasoner双智能体架构。在一个现实世界的应用场景中展示该架构的有效性,特别是在处理需要用户建模、使用专家知识提供科学支持的建议、提供多步骤辅导计划以及进行对话和同理心交流的复杂任务时。

睡眠辅导智能体的实现:

  1. Talker智能体:通过一组专家提供的指导原则来编码睡眠领域的专业知识,这些原则描述了智能体的构成(例如,表现出同理心、进行对话交流、提供准确的建议)以及睡眠辅导的不同阶段(理解、目标设定和辅导计划)。Talker智能体通过一个强大的语言模型实现,能够理解复杂的模式并提供深思熟虑的对话回应。

  2. Reasoner智能体:明确地对用户的信念进行建模。通过与临床专家的合作,作者编码了一个JSON/XML模式的信念,包括睡眠问题、目标、习惯、障碍和睡眠环境等字段。Reasoner智能体在执行多步推理/规划时,推断并更新这些模式字段,从而创建或更新其信念状态。

  3. Talker和Reasoner的协调:Talker智能体是否等待Reasoner智能体完成,取决于信念状态。在规划辅导阶段,Talker智能体会等待Reasoner智能体完成;否则,它不会等待。

定性结果:

  1. 示例对话:展示了Talker和Reasoner智能体之间的互动,包括如何根据用户的需求生成回应和计划,以及如何根据用户的反馈调整计划。

  2. 根据反馈调整计划:展示了Reasoner智能体如何根据Talker智能体从用户那里收集的反馈来调整其计划。

以下是一段示例对话,展示了Reasoner和Talker之间的互动:

用户:嘿,我需要你的帮助来规划如何营造一个放松的睡前环境。(记忆中的信念更新为:{updated-context: starting context, updated-title: Sleep Coaching, coachingphase: UNDERSTANDING})
Talker:太好了,我们开始为你打造一个放松的睡前环境吧:-) 你的卧室里有没有什么可能会干扰你睡眠的东西?
用户:我觉得噪音和光线太分散注意力了。你能帮我制定一个消除这些干扰的计划吗?(记忆中的信念保持不变)
Talker:当然可以!这里有一个消除卧室干扰的计划:噪音:
确定噪音源:列出卧室中所有的噪音源隔绝外界噪音:使用遮光窗帘来阻挡光线和减少噪音;考虑使用降噪窗帘或隔音板;试试耳塞或白噪音机。光线:...记住,一致性是关键。每晚都坚持这个计划,以营造一个平静而黑暗的睡眠环境。还有什么我可以帮助你的吗?
用户:当然,这很有用。不过,我希望步骤能更详细一些。还想看看如何在我的卧室里营造一个宁静放松的氛围的资源。(记忆中的信念更新为:{user context: UserCollectedContextData(primary-sleep-concern: Noise and light distractions in the bedroom), coaching phase: CoachingPhase(value=PLANNING)})
Reasoner的计划:当然!让我们更深入地看看你的计划的第一步:
步骤:选择一个平静的色彩调色板。描述:在选择卧室颜色时,选择柔和的中性色调,如柔和的蓝色、绿色或灰色。这些色调已被科学证明可以促进放松和宁静。1. YouTube视频:(链接)标题:创造放松和无压力卧室的墙面颜色创意。频道:roomdsignTV。推理:这个来自roomdsignTV的视频提供了平静卧室色彩调色板的视觉示例。它展示了舒缓色彩对营造宁静氛围的影响。2. YouTube播放列表:(链接)标题:Berger油漆色彩组合。频道:Hresun Interiors。推理:这个来自Hresun Interiors的播放列表提供了一系列的卧室色彩组合创意。它涵盖了从传统到现代的多种风格,帮助你找到适合卧室的完美色彩方案。
Talker:复制Reasoner的回应
##### 根据反馈调整计划
以下是Reasoner智能体如何根据Talker智能体从用户那里收集的反馈来调整其计划的示例:
用户:谢谢你,这非常有用。你能在我的计划中加入更多关于我应该在空间中添加哪些放松声音的步骤吗?(记忆中的信念保持不变)
Reasoner的计划:当然可以!这是你的计划中的“探索自然声音”部分,以及一些相关的YouTube内容:
探索自然声音:这个部分旨在帮助你使用自然声音在空间中创造一个平静和宁静的氛围。通过加入这些声音,你可以促进放松和减轻压力。推荐YouTube视频:...
发现治疗频率:在这个计划的部分,我们将探索治疗频率的世界,这些频率被认为对放松和情绪健康有深远的影响。...YouTube推荐:
https://arxiv.org/pdf/2410.08328Agents Thinking Fast and Slow: A Talker-Reasoner ArchitectureGoogle DeepMind

来源 | PaperAgent

Agent11

Agent · 目录

上一篇从0手搓4种Agentic模式,主打去框架化!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/55452.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

库卡ForceTorqueControl(二)

1. 基准坐标系RCS 基准坐标系 RCS 是力 / 力矩控制的参考系。基准坐标系的原点始终是当前的TCP。 1.1 BASE 的 RCS 姿态 基准坐标系的姿态与当前基础坐标系(基座坐标系)的姿态一致。它不取决于刀具的姿态。基准坐标系的原点是当前的 TCP。 示例&#xff…

【数据库设计】概念结构设计

引入——整体解释 上次我们讲完了关系模型,这次我们来讲新的章节:数据库设计 该怎样有效地管理和存储现实中的数据?答案是设计一个优秀的数据库。现实中的数据转化成关系表中的数据需要经过四个主要的设计步骤。 现实世界需求分析——>…

java常用工具包

Java标准库(Java Standard Library) 比喻:就像你厨房里的基础调料,没有它们,你很难做出美味的菜肴。Java标准库包含了进行基本编程所需的所有核心类和方法,如字符串处理、集合框架、输入输出操作等。 关键…

C++ 内存布局 - Part6: 虚继承

1. 关于虚继承 虚继承可以在菱形继承体系中,防止派生类中有多份重复祖基类内容。如下图所示,如果是常规继承,Class Final中会有两份Class Base的内容。通过虚继承,即Derived1 虚继承自Base, Derived2 也虚继承自Base, 那么Final中…

003_ipc概述及信号

【背景】 程序运行起来后,每个模块都有自己的进程,那么不同的模块如何进行通讯或者数据交换呢? 上面这张图说明了linux的ipc是继承最初的Unix 的IPC逻辑的,那么具体关系和概述讲解,请参考此链接的原文:htt…

mac 桌面版docker no space left on device

报错信息 docker pull镜像时报: failed to register layer: Error processing tar file(exit status 1): write /home/admin/oceanbase_bak/bin/observer: no space left on device 解决 增加 docker 虚拟磁盘大小。 调整完点击重启即可。

助力语音技术发展,景联文科技提供语音数据采集服务

语音数据采集是语音识别技术、语音合成技术以及其他语音相关应用的重要基础。采集高质量的语音数据有助于提高语音识别的准确性,同时也能够促进语音技术的发展。 景联文科技作为专业的数据采集标注公司,支持语音数据采集。可通过手机、专业麦克风阵列、专…

两个案例全面阐述全链路测试怎么做

首先我们先针对全链路功能测试部分进行一下讲解。去年的时候,有一家电商公司可能知道我一直在帮银行做相关的测试,就请我帮他们去做一些规划。这个平台有虚拟订单,也有实体订单,方式不太一样。 还涉及到分账分佣以及跟银行的对接…

大数据-174 Elasticsearch Query DSL - 全文检索 full-text query 匹配、短语、多字段 详细操作

点一下关注吧!!!非常感谢!!持续更新!!! 目前已经更新到了: Hadoop(已更完)HDFS(已更完)MapReduce(已更完&am…

计算机网络基础(1)

个人主页:C忠实粉丝 欢迎 点赞👍 收藏✨ 留言✉ 加关注💓本文由 C忠实粉丝 原创 计算机网络基础 收录于专栏【计算机网络】 本专栏旨在分享学习计算机网络的一点学习笔记,欢迎大家在评论区交流讨论💌 目录 1. 计算机网…

简易CPU设计入门:验证取指令模块【未完成】

项目代码下载 还是请大家首先准备好本项目所用的源代码。如果已经下载了,那就不用重复下载了。如果还没有下载,那么,请大家点击下方链接,来了解下载本项目的CPU源代码的方法。 下载本项目代码 准备好了项目源代码以后&#xff…

MySQL详细学习攻略 MySQL基础非常全面教程 MySQL安装教程

MySQL安装教程 章节目录 一、MySQL简介与安装前准备 二、Windows系统下MySQL的安装 三、Linux系统下MySQL的安装 四、MySQL安装后的基本配置 五、MySQL服务的启动与停止 六、MySQL客户端工具的使用 七、MySQL安装常见问题与解决方案 一、MySQL简介与安装前准备 重点内容知识…

Flythings学习(四)串口通信

文章目录 1 串口编程基本步骤1.1 打开串口1.2 配置串口 1.3 读串口1.4 发送串口1.5 关闭串口 2 综合使用3 如何在软件上保证串口稳定通信4 flythings中的串口通讯5 协议接收部分使用和修改方法6 通讯协议数据怎么和UI控件对接 1 串口编程基本步骤 串口通信有5个步骤 1.打开串口…

YOLOv11模型改进-注意力机制-引入自适应稀疏自注意力ASSA

随着目标检测领域的快速发展,YOLO系列模型凭借其端到端、高效的检测性能逐渐成为工业界和学术界的标杆。然而,如何进一步优化YOLOv11的特征提取能力,减少冗余信息并提升模型对复杂场景的适应性,仍是一个值得深入探讨的问题。为此&…

Android:记录一个打包发布版的release包以后闪退的问题

个人感觉其实release闪退的问题挺难排查的,因为release包运行起来as捕获不到相应的应用程序进程,从而不易查看到日志,也是我玩得不溜,大家有不同的方法可以评论区探讨,我也定期回复一些评论一起讨论。以下是我遇到的情…

【数据结构】宜宾大学-计院-实验三

线性表的应用——实现两多项式的相加 课前准备:实验学时:2实验目的:实验内容:实验结果:实验报告:(及时撰写实验报告)实验测试结果:代码实现:(C/C)…

安宝特方案 | AR技术在轨交行业的应用优势

随着轨道交通行业不断向智能化和数字化转型,传统巡检方式的局限性日益凸显。而安宝特AR眼镜以其独特的佩戴方式和轻便设计,为轨道交通巡检领域注入了创新活力,提供了全新的解决方案。 01 多样化佩戴方法,完美适应户外环境 安宝特…

访问控制列表(课内实验)

实验2:访问控制列表 实验目的及要求: 通过实验,进一步的理解标准ACL与扩展ACL的工作原理及执行过程。理解通配符的概念,熟练掌握标准ACL与扩展ACL的配置指令,掌握将访问控制列表应用VTY线路上,并且能够判断…

鸿蒙开发 四十五 鸿蒙状态管理(嵌套对象界面更新)

当运行时的状态变量变化,UI重新渲染,在ArkUI中称为状态管理机制,前提是变量必须被装饰器修饰。不是状态变量的所有更改都会引起刷新,只有可以被框架观测到的更改才会引起UI刷新。其中boolen、string、number类型,可观察…

Oracle漏洞修复 19.3 补丁包 升级为19.22

1.场景描述 上周末2024-10-12日,服务器扫出漏洞,希望及时修复。其中,oracle的漏洞清单如下,总结了下,基本都是 Oracle Database Server 的 19.3 版本到 19.20 版本和 21.3 版本到 21.11 版本存在安全漏洞,即版本问题。如: Oracle Database Server 安全漏洞(CVE-2023-22…