如何使用 CrewAI 构建协作型 AI Agents

一、前言

AI Agents 的开发是当前软件创新领域的热点。随着大语言模型 (LLM) 的不断进步,预计 AI 智能体与现有软件系统的融合将出现爆发式增长。借助 AI 智能体,我们可以通过一些简单的语音或手势命令,就能完成以往需要手动操作应用程序才能实现的任务。但目前, AI 智能体的开发还处于初期阶段,正如 1990 年代的互联网,我们还在基础设施、工具和框架开发的初步阶段探索前行。本文将介绍一个名为 CrewAI 的新型智能体开发框架。

本文主要包含以下内容

  • 认识 AI 智能体。
  • 探索 CrewAI —— 一个构建智能体的开源工具。
  • 学习如何构建一个共同创作内容的 AI 团队。
  • 了解 AI 智能体在现实生活中的应用案例。

二、什么是 AI Agents?

语言模型在翻译、总结和推理方面表现出色。但它们的潜力远不止于此。让大语言模型 (LLM) 具备代理性是充分挖掘其推理潜力的一种方法。AI 智能体就是被赋予适当工具和指令的 LLM,能够自动完成网页浏览、网络抓取、执行 SQL 查询、文件操作等任务。利用 LLM 的推理能力,这些智能体能够根据当前需求选择合适的工具。而且,我们还可以将多个智能体组合起来,共同完成更复杂的任务。

当我们谈论如何构建 AI Agents时,首先想到的工具就是 LangChain。然而,使用 LangChain 手动协调 AI 智能体执行协作任务可能会相当困难。CrewAI 正是为了解决这一问题而生。

三、什么是 CrewAI?

CrewAI 是一个开源框架,专门用于协调具有角色扮演和自主操作的 AI 智能体。它可以帮助我们轻松创建能够共同实现复杂目标协作的 AI 智能体。这个框架的设计目的是让 AI 智能体能够扮演不同的角色、分配任务并共享目标,就像现实世界中的团队成员一样。CrewAI 的几大特性包括:

  • 基于角色的AI智能体设计:定义具备特定角色、目标和背景故事的智能体,让 LLM 在生成回答前有更丰富的上下文。
  • 灵活的任务管理方式:通过可定制化工具定义任务,并能够动态地分配给不同的智能体。
  • 智能体间的自主委派机制:智能体能够自行决定任务分配并相互协作,这大大提高了解决问题的效率。
  • 流程驱动策略:目前系统只支持按顺序执行任务和按层级组织流程,Crew AI正在研发更为复杂的流程管理方式,比如基于共识和自主决策的流程。
  • 保存任务输出:可以将任务产生的数据保存为文件,便于后续使用。
  • 输出解析功能:根据需要,可以将任务输出解析成 Pydantic 模型或 Json 格式。
  • 支持开源模型集成:可以利用 Open AI 或其他开源模型来运行你的团队。

CrewAI 能够与 LangChain 生态系统无缝集成。这意味着我们可以利用 LangChain 提供的工具和大语言模型 (LLM) 的集成功能,与 CrewAI 一起工作。

CrewAI 是一个旨在增强人工智能代理协作的最先进框架。这种创新方法通过营造一个让人工智能代理作为一个统一团队更有效地运作的环境,解决了 Autogen 和 ChatDev 等现有解决方案的局限性。

AutoGen 在促进创建协同工作的对话代理方面发挥了重要作用。然而,当涉及到协调代理之间的交互时,尤其是对于较大的任务,它会遇到困难。另一方面,ChatDev引入了进程的概念,尽管缺乏灵活性和可扩展性,使其不太适合实际应用。 CrewAI 克服了这些挑战,并为人工智能协作树立了新标准。

四、CrewAI 的工作原理

在 CrewAI 的背后,CrewAI 的每个智能体在核心上都是基于 LangChain 的智能体,但它们被赋予了特殊的能力,通过 ReActSingleInputOutputParser 进行增强。这种特别设计的解析器不仅优化了角色扮演功能,还添加了用于增强上下文关注点的绑定停止词,并通过 LangChain 的会话摘要记忆机制实现了任务连续性。

由于这些智能体是构建在 LangChain 之上的,它们自然而然地带来了所谓的“飞轮效应”,最直接的好处就是你可以无缝接入所有 LangChain 提供的工具和工具包,极大地拓宽了应用场景。

目前版本的智能体能够独立自主运作,它们通过内部对话来选择合适的工具。不过,CrewAI 计划在未来版本中加入更多样化的流程类型,这将支持在不同的团队配置中进行协作,实现在运行时动态分配任务的能力。

任务从一开始就指定给智能体,并且可以根据需要调整智能体可用的工具,这样既可以灵活地指导智能体完成不同的任务,又避免了给它们分配过多工具造成的负担。

Crew 本质上是一个框架,它包含了智能体和任务,并促进了它们按顺序完成工作。在实践中,采用多个独立 Crew 的模块化部署方式往往更加高效,每个 Crew 包含少量智能体。这种方式不仅使每个 Crew 能够达到不同的成果,而且避免了单一大型 Crew 处理众多任务和智能体时可能出现的瓶颈。

五、构建协作 AI 团队

如果想要更深入地了解 CrewAI,我们可以尝试构建一个用于创意写作的协作 AI 团队。首先,我们需要设定智能体的角色、工具以及每个智能体的具体任务。在这个内容创作团队中,我们设想了三个角色:创意分析师、撰稿人和编辑。每个角色都将承担特定的任务。

创意分析师负责分析主题并制定详尽的写作大纲。撰稿人则根据大纲撰写文章初稿。最后,编辑将对初稿进行格式化、编辑和校对。正如我们所知,CrewAI 允许我们为智能体添加定制工具。例如,我们可以为编辑智能体添加一个工具,使其能够将文档保存到本地硬盘。为了实现这些功能,我们需要一个大语言模型 (LLM)。在这个例子中,我们选择了 Google 的 Gemini 模型。

接下来,让我们开始编码。

和任何 Python 项目一样,首先创建一个虚拟环境并安装必要的依赖库。我们需要 Crewai 库以及 LangChain 提供的 Google GenAI 实现。当然,你也可以选择其他大语言模型,比如 Anthropic、Ollama、Tongyi Qwen 或 OpenAI 提供的开放模型。

注:CrewAI 可以使用 Ollama(一个用于人工智能代理开发的开源库)在本地运行。此功能可实现与现有系统的无缝集成,并消除对外部 API 的依赖,从而确保数据隐私和安全。

pip install crewai langchain-google-genai

首先,我们需要定义我们的 LLM 和协作智能体。为此,创建一个名为 agents.py 的文件来定义这些智能体。

import osfrom crewai import Agent
from langchain.tools import tool
from langchain_google_genai import GoogleGenerativeAIGOOGLE_API_KEY = "Your Key"
llm = GoogleGenerativeAI(model="gemini-pro", google_api_key=GOOGLE_API_KEY)

接下来,我们定义一个文件保存工具。

class FileTools:@tool("Write File with content")def write_file(data: str):"""这个工具用于将指定内容写入到特定路径的文件中。
输入格式应该是一个由竖线 (|) 分隔的字符串,包含两部分:文件的完整路径(例如:./lore/...)和你想要写入文件的具体内容。"""try:path, content = data.split("|")path = path.replace("\n", "").replace(" ", "").replace("`", "")if not path.startswith("./lore"):path = f"./lore/{path}"with open(path, "w") as f:f.write(content)return f"File written to {path}."except Exception:return "Error with the input format for the tool."

上述的 write_file 方法使用了 LangChain 的工具函数进行装饰。由于 CrewAI 在后台使用 LangChain,所以工具必须遵循 LangChain 的规范。这个方法期望接收一个字符串,其中包含文件路径和内容,两者通过竖线 (|) 分隔。方法的文档字符串也作为函数的附加上下文,所以请确保提供详细的方法信息。

接下来,让我们定义智能体。

idea_analyst = Agent(role = "创意分析师",goal = "深入剖析创意,为文章撰写制定详细大纲。",backstory="""作为一名资深的内容分析师,你擅长深入挖掘创意,并为其制定出一套完整的写作计划。""",llm = llm,verbose=True
)
writer = Agent(role = "小说作家",goal = "根据分析师提供的创意,创作出吸引人的奇幻和科幻小说作品。",backstory="""作为一名享誉盛名的小说家,你曾两次荣登《人民文学》畅销书榜,专攻虚构和科幻领域。""",llm=llm,verbose=True
)editor = Agent(role= "内容编辑",goal = "对作家撰写的内容进行精心编辑。",backstory="""作为一名经验丰富的编辑,你在编辑书籍和故事方面拥有多年的专业经验,能够确保作品质量。
复制再试一次分享""",llm = llm,tools=[FileTools.write_file],verbose=True
)

我们有三个智能体,每个都有不同的角色、目标和背景故事。这些信息将作为提示,帮助 LLM 更好地理解上下文。编辑智能体还关联了一个写作工具。

接下来,我们需要定义任务。为此,创建一个名为 tasks.py 的文件。

from textwrap import dedentclass CreateTasks:def expand_idea():return dedent("""分析给定任务 {idea}。为完成给定任务准备全面的要点。确保想法切题、连贯且引人入胜。确保遵守规则。不要使用任何工具。规则:- 用项目符号列出想法。- 避免成人内容的想法。""")def write():return dedent("""根据创意分析师给出的蓝图想法,写一个1200字的引人入胜的故事。确保内容连贯、易于传达且吸引人。不要使用任何工具。 确保遵守规则。规则:- 写作必须语法正确。- 尽可能少使用术语""")def edit():return dedent("""查找任何语法错误,进行编辑和格式化(如果需要)。在需要时为文本添加标题和副标题。不要缩短内容或添加评论。为内容创建一个合适的文件名,使用 .txt 扩展名。你必须使用工具将其保存到路径 ./lore/(你的标题.txt) 中。""")

这里的任务是你希望智能体执行的具体行动计划。

最后,创建 main.py 文件,我们将在这里组合智能体和任务,构建一个功能完备的团队。

from textwrap import dedentfrom crewai import Crew, Taskfrom agents import editor, idea_analyst, writer
from tasks import CreateTasksclass ContentWritingCrew():def __init__(self, idea):self.idea = ideadef __call__(self):tasks = self._create_tasks()crew = Crew(tasks=tasks,agents=[idea_analyst, writer, editor],verbose=True)result = crew.kickoff()return resultdef _create_tasks(self):idea = CreateTasks.expand_idea().format(idea=self.idea)expand_idea_task = Task(description=idea,agent = idea_analyst)write_task =  Task(description=CreateTasks.write(),agent=writer)edit_task = Task(description=CreateTasks.edit(),agent=editor)return [expand_idea_task, write_task, edit_task]if __name__ == "__main__":dir = "./lore"if not os.path.exists(dir):os.mkdir(dir)idea = input("idea: ")my_crew = ContentWritingCrew(idea=idea)result = my_crew()print(dedent(result))

在上述代码中,我们定义了一个名为 ContentWritingCrew 的类,它接受用户输入的创意主题。_create_tasks 方法用于创建任务,而 call 方法则用于初始化并启动团队。运行脚本后,你可以在终端或笔记本上观察到一系列动作的执行。任务将按照团队定义的顺序执行。以下是执行日志的一个示例。

这是最终智能体,即编辑器的执行日志。它编辑了撰稿人智能体提供的初稿,并使用文件编写工具以合适的文件名保存文件。

这就是使用 CrewAI 创建协作 AI 智能体的基本流程。你还可以结合其他 LangChain 工具或创建自定义工具,通过有效的提示来完成更复杂的任务。

六、AI智能体应用案例

自主 AI 智能体在现实生活中有着广泛的应用前景。从个人助理到虚拟教练,以下是一些 AI 智能体的实际应用案例。

个人 AI 助理:不久的将来,个人助理将成为我们日常生活的一部分。想象一下,有一个像 Jarvis 那样的智能助理,它能处理你的所有数据,实时提供有用的信息,并自动完成一些日常琐事。

代码解释器:OpenAI 的代码解释器展示了 AI 智能体的强大潜力。这个解释器能够执行任何 Python 脚本,并根据文本提示返回结果。这可能是迄今为止最成功的 AI 智能体应用之一。

虚拟教练:随着 AI 技术的不断进步,我们可以预见在教育、培训等领域将出现大量的虚拟教练。

智能体优先软件开发:AI 智能体在软件开发领域有着巨大的应用潜力。与传统的手动操作相比,AI 智能体能够根据语音指令自动完成各种任务。

空间计算:随着增强现实 (AR) 和虚拟现实 (VR) 技术的不断发展,AI 智能体将在虚拟世界与现实世界之间架起桥梁,发挥至关重要的作用。

七、总结

尽管我们仍处于 AI 智能体开发的初级阶段,但目前要实现 AI 智能体的最佳性能,我们还需要依赖于 GPT-4,这在成本上可能较为昂贵。然而,随着开源模型逐渐赶上 GPT-4,我们将有更多的选择,能够在合理的成本下高效运行 AI 智能体。同时,智能体开发的框架也在不断进步,未来将使智能体能够执行更加复杂的任务。

7.1、关键要点

  • AI 智能体利用大语言模型 (LLM) 的推理能力,选择适当的工具来完成复杂任务。
  • CrewAI 是一个构建协作 AI 智能体的开源框架。
  • CrewAI 的独特特性包括基于角色的智能体设计、智能体间的自主委托以及灵活的任务管理。
  • CrewAI 能够与现有的 LangChain 生态系统无缝集成,我们可以结合使用 LangChain 工具和大语言模型 (LLM) 与 CrewAI。

八、References

[1]. CrewAI GitHub:https://github.com/joaomdmoura/crewAI

[2]. Google GenAI:https://python.langchain.com/docs/integrations/llms/google_ai

[3]. Ollama:https://python.langchain.com/docs/integrations/llms/ollama

[4]. Tongyi Qwen:https://python.langchain.com/docs/integrations/llms/tongyi

[5]. Building AI Agents: https://www.analyticsvidhya.com/blog/2024/01/building-collaborative-ai-agents-with-crewai/

[6]. CrewAI Docs:https://docs.crewai.com/

[7]. CrewAI Examples:https://github.com/joaomdmoura/crewAI-examples

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/717559.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

运维的利器–监控–zabbix–grafana

运维的利器–监控–zabbix–grafana 一、介绍 Grafana 是一个跨平台的开源的度量分析和可视化工具 , 可以通过将采集的数据查询然后可视化的展示 。zabbix可以作为数据源,为grafana提供数据,然后grafana将数据以图表或者其他形式展示出来。zabbix和gra…

基于YOLOv的目标追踪与无人机前端查看系统开发

一、背景与简介 随着无人机技术的快速发展,目标追踪成为无人机应用中的重要功能之一。YOLOv作为一种高效的目标检测算法,同样适用于目标追踪任务。通过集成YOLOv模型,我们可以构建一个无人机前端查看系统,实现实时目标追踪和可视化…

零基础学编程,中文编程工具之进度标尺构件的编程用法

零基础学编程,中文编程工具之进度标尺构件的编程用法 一、前言 今天给大家分享的中文编程开发语言工具 进度条构件的用法。 编程入门视频教程链接 https://edu.csdn.net/course/detail/39036 编程工具及实例源码文件下载可以点击最下方官网卡片——软件下载——…

机器人持续学习基准LIBERO系列9——数据集轨迹查看

0.前置 机器人持续学习基准LIBERO系列1——基本介绍与安装测试机器人持续学习基准LIBERO系列2——路径与基准基本信息机器人持续学习基准LIBERO系列3——相机画面可视化及单步移动更新机器人持续学习基准LIBERO系列4——robosuite最基本demo机器人持续学习基准LIBERO系列5——…

Python AI 实现绘画功能(附带源码)

本文我们将为大家介绍如何基于一些开源的库来搭建一套自己的 AI 作图工具。 需要使用的开源库为 Stable Diffusion web UI,它是基于 Gradio 库的 Stable Diffusion 浏览器界面 Stable Diffusion web UI GitHub 地址:GitHub - AUTOMATIC1111/stable-dif…

快速解决maven依赖冲突

我们在开发过程中经常出现maven依赖冲突,或者maven版本不匹配的情况,我们可以使用阿里云原生脚手架来做maven管理,添加需要的组件,然后点击获取代码,就可以获得对应的依赖文件。

【重要公告】对BSV警报系统AS的释义

​​发表时间:2024年2月15日 由BSV区块链协会开发并管理的BSV警报系统(Alert System,以下简称“AS”)是BSV网络的重要组件。它是一个复杂的系统,主要职能是在BSV区块链网络内发布信息。这些信息通常与网络访问规则NAR相…

c# 任务(Task)介绍

任务(Task) Task作为C#异步的核心,Task位于System.Threading.Tasks命名空间下。 创建任务的基本原理是使用线程池,也就是说任务最终也是要交给线程去执行的。但是微软优化了任务的线程池,使线程的控制更加精准和高效…

自定义TypeHandler

自定义TypeHandler 继承BaseTypeHandler指定具体的泛型 MappedTypes({Date.class}) MappedJdbcTypes({JdbcType.DATE}) public class DateTimeWithTImeZoneTypeHandler extends BaseTypeHandler<Date> {Log log LogFactory.getLog(DateTimeWithTImeZoneTypeHandler.cl…

C++基于多设计模式下的同步异步日志系统day4

&#x1f4df;作者主页&#xff1a;慢热的陕西人 &#x1f334;专栏链接&#xff1a;C基于多设计模式下的同步&异步日志系统 &#x1f4e3;欢迎各位大佬&#x1f44d;点赞&#x1f525;关注&#x1f693;收藏&#xff0c;&#x1f349;留言 只要内容主要实现了同步日志消息…

Kubernetes的Sevice管理

服务原理: 所有服务都是根据这个服务衍生或者变化出来,根服务---- 服务感知后端靠标签 slelector 标签选择器 kubectl label pods web1 appweb kubectl cluter-info dump | grep -i service-cluster-ip-range 服务ip取值范围 Service 管理: 创建服务: --- kind: Serv…

React富文本编辑器开发(六)

现在&#xff0c;相关的基础知识我们应该有个大概的了解了&#xff0c;但离我们真正的开发出一个实用型的组件还有一段距离&#xff0c;不过不用担心&#xff0c;我们离目标已经越来越近。 以现在我们所了解的内容而言&#xff0c;或许你发现了一个问题&#xff0c;就是我们的编…

CentOS配网报错:network is unreachable

常用命令&#xff1a; 打开&#xff1a; cd /etc/sysconfig/network-scripts/ 修改&#xff1a; vim ifcfg-ens33 打开修改&#xff1a; vim /etc/sysconfig/network-scripts/ifcfg-ens33 保存&#xff1a; 方法1&#xff1a;ESCZZ&#xff08;Z要大写&#xff09; 方…

LabelImg官方文档摘录

LabelImg官方文档&#xff1a;https://github.com/HumanSignal/labelImg 注释&#xff08;annotation&#xff09;以 PASCAL VOC 格式保存为 XML 文件&#xff0c;这是ImageNet使用的格式。此外&#xff0c;它还支持 YOLO 和 CreateML 格式。 安装 使用CSDN博主打包的程序&a…

Linux:地址空间的转换以及线程的理解和使用

文章目录 线程的理解地址空间的转换问题总结 线程的优点线程的缺点线程的健壮性问题 本篇主要进行对于进程和线程的理解&#xff0c;以及对于线程的一部分使用方法和使用的原理 线程的理解 首先回顾前面一篇的内容中&#xff0c;对于进程的基本认识&#xff1a; 什么是线程&…

OWASP TOP 10解析:构建坚不可摧的Web应用安全防线

当涉及到Web应用程序安全的话题时&#xff0c;OWASP&#xff08;开放式Web应用程序安全项目&#xff09;的TOP 10是一个不可忽视的参考点。OWASP TOP 10列举了当前Web应用程序中最严重的安全风险&#xff0c;帮助开发人员、测试人员和安全专业人员更好地理解并针对这些风险采取…

【LeetCode:2368. 受限条件下可到达节点的数目 + BFS】

&#x1f680; 算法题 &#x1f680; &#x1f332; 算法刷题专栏 | 面试必备算法 | 面试高频算法 &#x1f340; &#x1f332; 越难的东西,越要努力坚持&#xff0c;因为它具有很高的价值&#xff0c;算法就是这样✨ &#x1f332; 作者简介&#xff1a;硕风和炜&#xff0c;…

Mybatis实战(1)

mybatis-pageHelper 1&#xff0c;添加依赖&#xff1a; <dependency><groupId>org.mybatis.spring.boot</groupId><artifactId>mybatis-spring-boot-starter</artifactId><version>1.3.2</version></dependency><!--pag…

SpringBoot-yaml语法

1.概念 在Springboot的项目中&#xff0c;配置文件有以下几种格式&#xff1a; Application.propertiesApplication.yamlApplication.yml 其中官方推荐我们使用yaml的格式(因为能表示的数据类型很多样) 2.基本语法 # yaml形式的配置文件# 普通的key-value&#xff08;分号之后…

用numpy搭建自己的神经网络

搭建之前的基础与思考 构建模型的基本思想&#xff1a; 构建深度学习的过程&#xff1a;产生idea&#xff0c;将idea转化成code&#xff0c;最后进行experiment&#xff0c;之后根据结果修改idea&#xff0c;继续idea–>code–>experiment的循环&#xff0c;直到最终训练…