吴恩达:AI 智能体工作流

热门文章推荐

  • (1)《为什么很多人工作 3 年 却只有 1 年经验?》
  • (2)《一文掌握大模型提示词技巧:从战略到战术巧》
  • (3)《AI 时代,程序员的出路在何方?》
  • (4)《如何写出高质量的文章:从战略到战术》
  • (5)《我的技术学习方法论》
  • (6)《我的性能方法论》
  • (7)《AI 时代的学习方式: 和文档对话》

省流版:
在这里插入图片描述

一、背景

吴恩达近日做了题为《What’s next for AI agentic workflows ft》的非常有价值的分享。

1.1 Agent 工作流

分享中指出不用 Agent 工作流时通过一次对话得到答案,效果往往不是很好。通过智能体工作流进行步骤拆分不断迭代,效果会更好。

在这里插入图片描述

代码基准测试中 GPT 3.5 准确率为 48% ,而 GPT-4 的准确率是 67%。但是加入智能体工作流的方式,GPT 3.5 甚至可以比单纯使用 GPT-4 的表现更好。
在这里插入图片描述

1.2 四种设计模式

在分享中他提出 AI 智能体的四种设计模式。
在这里插入图片描述

反思(Reflection): LLM 检查自己的工作,以提出改进方法。

使用工具(Tool use):LLM 拥有网络搜索、代码执行或任何其他功能来帮助其收集信息、采取行动或处理数据。

规划(Planning):LLM 提出并执行一个多步骤计划来实现目标。

多智能体协作(Multi-agent collaboration):多个 AI 智能体一起工作,分配任务并讨论和辩论想法,提出比单个智能体更好的解决方案。

在这里插入图片描述

1. 反射(Reflection)

  • 定义:反射模式允许 AI 代理自我审视其产出,评估正确性、效率和构造质量。通过这种方式,AI 能够识别并修正自身产出中的错误,从而提高最终产物的质量。
    在这里插入图片描述

在这里插入图片描述

  • 相关论文

    • 《Self-Refine: Iterative Refinement with Self-Feedback》
    • 《Reflexion: Language Agents with Verbal Reinforcement Learning》
  • 应用实例:一个典型的应用是代码编写。AI 首先生成代码,然后再次审视这段代码,检查是否有逻辑错误或可以优化的地方,并据此进行修改。这种自我修正的过程可能循环进行多次,直到代码达到预期的标准。

2. 多工具使用(Tool Use)

  • 定义:这种模式指的是AI代理能够利用多种工具和资源来完成任务,例如进行网络搜索、调用其他软件接口等。这扩展了AI的能力,使其不仅限于单一任务或领域。
    在这里插入图片描述

  • 相关论文

    • 《Gorilla: Large Language Model Connected with Massive APIs》
    • 《MM-REACT: Prompting ChatGPT for Multimodal Reasoning and Action》
  • 应用实例:在处理需要外部信息或特定领域工具的任务时,AI 代理可以先识别出所需的工具或信息源,然后获取并应用这些资源来完成任务。比如,生成一段代码前,先通过网络搜索相关的算法或逻辑。

3. 计划算法(Planning)

  • 定义:计划算法使AI代理能够设计一系列有序的步骤来解决复杂问题,这通常涉及到前瞻性思维和策略规划。
    在这里插入图片描述

  • 相关论文

    • 《Chain-of-Thought Prompting Elicits Reasoning in Large Language Models》
    • 《HuggingGPT: Solving AI Tasks with ChatGPT and its Friends in Hugging Face》
  • 应用实例:AI 代理可以根据给定的目标自动规划出实现路径,比如在开发一个新项目时,AI能够规划出研究、设计、编码、测试等一系列步骤,并自动执行这一计划,甚至在遇到问题时重新规划以绕过障碍。

4. 多 Agent 合作(Multi-agent Collaboration)

  • 定义:这种模式涉及到多个 AI 代理相互协作,每个代理可能负责不同的任务或扮演不同的角色,通过协作来解决问题或完成任务。
    在这里插入图片描述

图中引用的是 :ChatDev 的例子。

  • 相关论文

    • 《Communicative Agents for Software Development》
    • 《AutoGen: Enabling Next-Gen LLM Applications via Multi-Agent Conversation》
  • 应用实例:在软件开发的场景中,一个 AI 代理可能扮演项目经理的角色,负责规划项目和分配任务,另一个 AI 代理扮演开发者角色,负责编写代码,还有的 AI 代理可能专注于测试和代码审查。这些代理通过相互协作,能够自动完成一个软件开发项目。

每种设计模式都体现了AI代理工作流在提高任务处理效率、增强问题解决能力方面的潜力,预示着AI技术在复杂任务处理和自动化方面的未来发展方向。

二、对未来的预测与挑战

吴教授预测,智能体工作流将在未来几年内极大扩展 AI 的能力边界。

在这里插入图片描述

他强调了快速的 token 生成的重要性,认为这将支持更有效的迭代和改进过程。同时,他提到了对于即时反馈期望的调整,指出在使用AI智能体工作流时,我们需要学会耐心等待。

三、我的一些思考

3.1 关于计划模式

对于计划模式虽然 Agent 能够比较容易识别“错误”,但有些并不是错误而是和目标偏离的情况不容易被发现,导致最终执行的结果不符合预期。对于这种任务,应该在执行之前进行详细的规划和确认,就像软件工程师在写代码之前就需要先做技术方案并评审一样。在执行过程中也要在关键的环节进行检查和确认,避免到最后环节才发现问题返工重做。

在这里插入图片描述

就像在执行过程中关键环节的检查和确认一样,你在旅途中可能设立几个检查点来确认是否还在正确的路线上,装备是否齐全,和队伍是否完好。如果你等到到达露营地后才发现忘记带帐篷或食物,那么整个露营计划可能都要泡汤,就像在项目的最后阶段才发现问题,需要返工重做一样,不仅耽误时间还可能增加成本。

3.2 关于多 Agent 合作模式

对于多 Agent 合作模式:理论上分工明确各司其职,就可以做好。但应该有一个 Agent 能够把控全局或者后续 Agent 不仅要干好自己的活还应该了解做事的背景和价值,以便更好地做事情。对于多代 Agent 合作模式,一个非常重要的点是在开始前最好需求的对齐,避免产出不符合预期的软件浪费很多计算资源。

在这里插入图片描述

3.3 关于产品形态

现在的 AI 平台还没有跟上这些设计模式,如让同一个平台的多个 Agent 之间,甚至不同平台的 Agent 之间可以非常好地交流协作。现在的很多 AI 平台并没有解决这些设计模式中的一些问题,如自动计划算法,如何在任务执行中间进行检查,避免有一个步骤走偏后面越来越离谱。

四、总结

Agent 工作流让大语言模型发挥出更大价值。文中提出的四种设计模式对 Agent 发展提供了非常重要的指导,值得继续探索。当然,四种设计模式落地过程中还存在诸多问题,需要警惕和克服。当前的产品形态还不能非常好地支撑这些模式,还还很长的路要走。

实战技巧参见:《用扣子/Coze 揭秘吴恩达的4种 AI Agent 设计模式》


参考资料:

  • 《What’s next for AI agentic workflows ft》
  • https://www.deeplearning.ai/the-batch/issue-242/
  • 《【人工智能】AI智能体工作流 | Agentic Reasoning | 吴恩达Andrew Ng | 红杉AI Ascent 2024分享 | Agent 4大设计模式》

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/796811.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

RGB三通道和灰度值的理解

本文都是来自于chatGPT的回答!!! 目录 Q1:像素具有什么属性?Q2:图像的色彩是怎么实现的?Q3:灰度值和颜色值是一个概念吗?Q4:是不是像素具有灰度值,也有三个颜色分量RGB?Q5:灰度图像是没有色彩的吗?Q6: 彩色图像是既具有灰度值也具有RGB三…

简历复印--原型模式

1.1 夸张的简历 简历的打印。"对编程来说,简单的复制粘贴极有可能造成重复代码的灾难。我所说的意思你根本还没听懂。那就以刚才的例子,我出个需求你写写看,要求有一个简历类,必须要有姓名,可以设置性别和年龄&am…

web自动化测试系列-如何选择实战项目(四)

目录 1.项目安装 2.项目优点 3.项目介绍 3.1 项目介绍 3.3 商品展示 接上文 :web自动化测试系列-页面元素该如何定位?(三)-CSDN博客 在后续的技术操作中都将会使用到项目 ,如果你有自己的练手项目 ,优先拿自己的项目做练习&#xff0c…

【话题】如何看待那些速成并精通软件书籍的神器

大家好,我是全栈小5,欢迎阅读小5的系列文章,这是《话题》系列文章 目录 背景1. 神话与现实1.1 理论与实践之间的鸿沟1.2 一劳永逸的错觉 2. 速成书籍的优势与局限2.1 优势:2.2 局限: 3. 如何有效利用速成书籍3.1 量力而…

算法——链表(1)

T04BF 👋专栏: 算法|JAVA|MySQL|C语言 🫵 小比特 大梦想 此篇文章与大家分享链表专题的第一部分 如果有不足的或者错误的请您指出! 1.链表常用技巧总结 1.1引入虚拟头结点 在力扣上,基本提供的链表题目都是"无头的",但是针对无头链表,我们最…

【话题】程序员35岁会失业吗?

大家好,我是全栈小5,欢迎阅读小5的系列文章,这是《话题》系列文章 目录 背景招聘分析一、技术更新换代的挑战二、经验与技术的双重优势三、职业发展的多元化选择四、个人成长与职业规划的平衡五、结语文章推荐 背景 35岁被认为是程序员职业生…

数据治理与大数据平台解决方案(免费|可下载)

1、知识星球下载: 如需下载完整PPTX可编辑源文件,请前往星球获取:https://t.zsxq.com/191Y7dD3p 2、免费领取步骤: 【1】关注公众号 方案驿站 【2】私信发送 数据治理与大数据平台 【3】获取本方案PDF下载链接,直接…

007 CSS的继承和层叠 元素特性

文章目录 CSS属性的继承CSS属性的层叠选择器的权重 HTML元素的类型编写HTML注意事项元素隐藏方法CSS属性-overflowCSS样式不生效可能原因 CSS属性的继承 如果一个属性具备继承性,那么在该元素上设置后,它的后代元素都可以继承这个属性 如果后代元素自己…

2023年度总结:允许迷茫,破除迷茫;专注自身,把握当下

0、前言 📜为什么24年已经过了几个月,才提笔写这年度总结呢?毫不羞愧直问我的内心,其实就是懒罢了。直到前几天朋友看到了我去年写的总结,我自己点进那篇总结,完完整整的看了一遍,又翻看我23年…

C语言 | Leetcode C语言题解之第12题整数转罗马数字

题目: 题解: const char* thousands[] {"", "M", "MM", "MMM"}; const char* hundreds[] {"", "C", "CC", "CCC", "CD", "D", "DC"…

Vue2(完结):replace属性、编程式路由导航、缓存路由组件、两个新钩子、路由守卫、history与hash

一、router-link的replace属性 1、作用:控制路由跳转时操作浏览器历史记录的模式 2、浏览器的历史记录有两种写入方式:分别为push和replace,push是追加历史记录,replace是替换当前记录。路由跳转时候默认为push 3、如何开启repla…

敏感信息泄露漏洞

法律声明 参与培训需要遵守国家法律法规,相关知识只做技术研究,请勿用于违法用途,造成任何后果自负与本人无关。 中华人民共和国网络安全法(2017年6月1日起施行) 第二十二条 任何个人和组织不得从事入侵他人网络、干扰…

C——找单身狗2

题目内容: 在一个数组中,室友两个数字出现了一次,其他所有数字都出现了两次。找出只出现一次的数字。 如:1,2,3,4,5,1,2,3,4&#xff…

【云计算】云数据中心网络(一):VPC

云数据中心网络(一):VPC 1.什么是 VPC2.VPC 的组成2.1 虚拟交换机2.2 虚拟路由器 3.VPC 网络规划3.1 VPC 数量规划3.2 交换机数量规划3.3 地址空间规划3.4 不同规模企业地址空间规划实践 4.VPC 网络高可靠设计4.1 单地域单可用区部署4.2 单地…

【Vue3】自定义Modal的fixed无效

现有一个模态框&#xff0c;目前一切正常&#xff0c;Modal可以在视口正确位置展示 <template><div class"father"><h3>模态框的父组件</h3><button click"showModal !showModal">显示/隐藏modal</button><div …

NzN的C++之路--this指针

在已经入门了类和对象之后&#xff0c;今天我们来到了类和对象的part2部分--this指针。先三连后看是好习惯&#xff01;&#xff01;&#xff01; 目录 一、this指针的引入 二、this指针的特性 三、this指针必会 四、C语言和C实现Stack的对比 1. C语言实现 2. C实现 一、…

如何确认RID池是否耗尽,以及手动增加RID池大小

确认RID池是否耗尽&#xff1a; 事件查看器&#xff1a; 在RID主控域控制器上打开事件查看器&#xff0c;导航至“Windows日志 > 应用程序和服务日志 > Microsoft > Windows > Directory Service > Operations”。搜索事件ID 16656和16657。事件ID 16656表明RID…

Jupyterlab+内网云穿透傻瓜式教程

文章目录 Jupyterlab内网云穿透傻瓜式教程1、Miniforge安装2、Jupyter Lab安装3、Python语言服务器安装4、PowerShell 7安装5、更改jupyter lab配置6、内网穿透7、高级体验 Jupyterlab内网云穿透傻瓜式教程 1、Miniforge安装 如下图&#xff0c;以Windows安装为例&#xff0c…

DFS:floodfill算法解决矩阵联通块问题

floodfill&#xff0c;翻译为洪水灌溉&#xff0c;而floodfill算法本质上是为了解决在矩阵中性质相同的联通块问题。 一、图像渲染 . - 力扣&#xff08;LeetCode&#xff09; class Solution { public:int dx[4]{0,0,1,-1};int dy[4]{1,-1,0,0};int prev;//记住初始值int m,…

LangChain-10(2) 加餐 编写Agent获取本地Docker运行情况 无技术含量只是思路

可以先查看 上一节内容&#xff0c;会对本节有更好的理解。 安装依赖 pip install langchainhub编写代码 核心代码 tool def get_docker_info(docker_name: str) -> str:"""Get information about a docker pod container info."""result…