AI Agents之CrewAI智能体开发框架

一、前言

AI Agents 的开发是当前软件创新领域的热点。随着大语言模型 (LLM) 的不断进步,预计 AI 智能体与现有软件系统的融合将出现爆发式增长。借助 AI 智能体,我们可以通过一些简单的语音或手势命令,就能完成以往需要手动操作应用程序才能实现的任务。但目前, AI 智能体的开发还处于初期阶段,正如 1990 年代的互联网,我们还在基础设施、工具和框架开发的初步阶段探索前行。本文将介绍一个名为 CrewAI 的新型智能体开发框架。

本文主要包含以下内容

  • 认识 AI 智能体。
  • 探索 CrewAI —— 一个构建智能体的开源工具。
  • 学习如何构建一个共同创作内容的 AI 团队。
  • 了解 AI 智能体在现实生活中的应用案例。

二、什么是 AI Agents?

语言模型在翻译、总结和推理方面表现出色。但它们的潜力远不止于此。让大语言模型 (LLM) 具备代理性是充分挖掘其推理潜力的一种方法。AI 智能体就是被赋予适当工具和指令的 LLM,能够自动完成网页浏览、网络抓取、执行 SQL 查询、文件操作等任务。利用 LLM 的推理能力,这些智能体能够根据当前需求选择合适的工具。而且,我们还可以将多个智能体组合起来,共同完成更复杂的任务。

当我们谈论如何构建 AI Agents时,首先想到的工具就是 LangChain。然而,使用 LangChain 手动协调 AI 智能体执行协作任务可能会相当困难。CrewAI 正是为了解决这一问题而生。

三、什么是 CrewAI?

CrewAI 是一个开源框架,专门用于协调具有角色扮演和自主操作的 AI 智能体。它可以帮助我们轻松创建能够共同实现复杂目标协作的 AI 智能体。这个框架的设计目的是让 AI 智能体能够扮演不同的角色、分配任务并共享目标,就像现实世界中的团队成员一样。CrewAI 的几大特性包括:

  • 基于角色的AI智能体设计:定义具备特定角色、目标和背景故事的智能体,让 LLM 在生成回答前有更丰富的上下文。
  • 灵活的任务管理方式:通过可定制化工具定义任务,并能够动态地分配给不同的智能体。
  • 智能体间的自主委派机制:智能体能够自行决定任务分配并相互协作,这大大提高了解决问题的效率。
  • 流程驱动策略:目前系统只支持按顺序执行任务和按层级组织流程,Crew AI正在研发更为复杂的流程管理方式,比如基于共识和自主决策的流程。
  • 保存任务输出:可以将任务产生的数据保存为文件,便于后续使用。
  • 输出解析功能:根据需要,可以将任务输出解析成 Pydantic 模型或 Json 格式。
  • 支持开源模型集成:可以利用 Open AI 或其他开源模型来运行你的团队。

CrewAI 能够与 LangChain 生态系统无缝集成。这意味着我们可以利用 LangChain 提供的工具和大语言模型 (LLM) 的集成功能,与 CrewAI 一起工作。

CrewAI 是一个旨在增强人工智能代理协作的最先进框架。这种创新方法通过营造一个让人工智能代理作为一个统一团队更有效地运作的环境,解决了 Autogen 和 ChatDev 等现有解决方案的局限性。

AutoGen 在促进创建协同工作的对话代理方面发挥了重要作用。然而,当涉及到协调代理之间的交互时,尤其是对于较大的任务,它会遇到困难。另一方面,ChatDev引入了进程的概念,尽管缺乏灵活性和可扩展性,使其不太适合实际应用。 CrewAI 克服了这些挑战,并为人工智能协作树立了新标准。

四、CrewAI 的工作原理

在 CrewAI 的背后,CrewAI 的每个智能体在核心上都是基于 LangChain 的智能体,但它们被赋予了特殊的能力,通过 ReActSingleInputOutputParser 进行增强。这种特别设计的解析器不仅优化了角色扮演功能,还添加了用于增强上下文关注点的绑定停止词,并通过 LangChain 的会话摘要记忆机制实现了任务连续性。

由于这些智能体是构建在 LangChain 之上的,它们自然而然地带来了所谓的“飞轮效应”,最直接的好处就是你可以无缝接入所有 LangChain 提供的工具和工具包,极大地拓宽了应用场景。

目前版本的智能体能够独立自主运作,它们通过内部对话来选择合适的工具。不过,CrewAI 计划在未来版本中加入更多样化的流程类型,这将支持在不同的团队配置中进行协作,实现在运行时动态分配任务的能力。

任务从一开始就指定给智能体,并且可以根据需要调整智能体可用的工具,这样既可以灵活地指导智能体完成不同的任务,又避免了给它们分配过多工具造成的负担。

Crew 本质上是一个框架,它包含了智能体和任务,并促进了它们按顺序完成工作。在实践中,采用多个独立 Crew 的模块化部署方式往往更加高效,每个 Crew 包含少量智能体。这种方式不仅使每个 Crew 能够达到不同的成果,而且避免了单一大型 Crew 处理众多任务和智能体时可能出现的瓶颈。

五、构建协作 AI 团队

如果想要更深入地了解 CrewAI,我们可以尝试构建一个用于创意写作的协作 AI 团队。首先,我们需要设定智能体的角色、工具以及每个智能体的具体任务。在这个内容创作团队中,我们设想了三个角色:创意分析师、撰稿人和编辑。每个角色都将承担特定的任务。

创意分析师负责分析主题并制定详尽的写作大纲。撰稿人则根据大纲撰写文章初稿。最后,编辑将对初稿进行格式化、编辑和校对。正如我们所知,CrewAI 允许我们为智能体添加定制工具。例如,我们可以为编辑智能体添加一个工具,使其能够将文档保存到本地硬盘。为了实现这些功能,我们需要一个大语言模型 (LLM)。在这个例子中,我们选择了 Google 的 Gemini 模型。

接下来,让我们开始编码。

和任何 Python 项目一样,首先创建一个虚拟环境并安装必要的依赖库。我们需要 Crewai 库以及 LangChain 提供的 Google GenAI 实现。当然,你也可以选择其他大语言模型,比如 Anthropic、Ollama、Tongyi Qwen 或 OpenAI 提供的开放模型。

注:CrewAI 可以使用 Ollama(一个用于人工智能代理开发的开源库)在本地运行。此功能可实现与现有系统的无缝集成,并消除对外部 API 的依赖,从而确保数据隐私和安全。

pip install crewai langchain-google-genai

首先,我们需要定义我们的 LLM 和协作智能体。为此,创建一个名为 agents.py 的文件来定义这些智能体。

import osfrom crewai import Agent
from langchain.tools import tool
from langchain_google_genai import GoogleGenerativeAIGOOGLE_API_KEY = "Your Key"
llm = GoogleGenerativeAI(model="gemini-pro", google_api_key=GOOGLE_API_KEY)

接下来,我们定义一个文件保存工具。

class FileTools:@tool("Write File with content")def write_file(data: str):"""这个工具用于将指定内容写入到特定路径的文件中。
输入格式应该是一个由竖线 (|) 分隔的字符串,包含两部分:文件的完整路径(例如:./lore/...)和你想要写入文件的具体内容。"""try:path, content = data.split("|")path = path.replace("\n", "").replace(" ", "").replace("`", "")if not path.startswith("./lore"):path = f"./lore/{path}"with open(path, "w") as f:f.write(content)return f"File written to {path}."except Exception:return "Error with the input format for the tool."

上述的 write_file 方法使用了 LangChain 的工具函数进行装饰。由于 CrewAI 在后台使用 LangChain,所以工具必须遵循 LangChain 的规范。这个方法期望接收一个字符串,其中包含文件路径和内容,两者通过竖线 (|) 分隔。方法的文档字符串也作为函数的附加上下文,所以请确保提供详细的方法信息。

接下来,让我们定义智能体。

idea_analyst = Agent(role = "创意分析师",goal = "深入剖析创意,为文章撰写制定详细大纲。",backstory="""作为一名资深的内容分析师,你擅长深入挖掘创意,并为其制定出一套完整的写作计划。""",llm = llm,verbose=True
)
writer = Agent(role = "小说作家",goal = "根据分析师提供的创意,创作出吸引人的奇幻和科幻小说作品。",backstory="""作为一名享誉盛名的小说家,你曾两次荣登《人民文学》畅销书榜,专攻虚构和科幻领域。""",llm=llm,verbose=True
)editor = Agent(role= "内容编辑",goal = "对作家撰写的内容进行精心编辑。",backstory="""作为一名经验丰富的编辑,你在编辑书籍和故事方面拥有多年的专业经验,能够确保作品质量。
复制再试一次分享""",llm = llm,tools=[FileTools.write_file],verbose=True
)

我们有三个智能体,每个都有不同的角色、目标和背景故事。这些信息将作为提示,帮助 LLM 更好地理解上下文。编辑智能体还关联了一个写作工具。

接下来,我们需要定义任务。为此,创建一个名为 tasks.py 的文件。

from textwrap import dedentclass CreateTasks:def expand_idea():return dedent("""分析给定任务 {idea}。为完成给定任务准备全面的要点。确保想法切题、连贯且引人入胜。确保遵守规则。不要使用任何工具。规则:- 用项目符号列出想法。- 避免成人内容的想法。""")def write():return dedent("""根据创意分析师给出的蓝图想法,写一个1200字的引人入胜的故事。确保内容连贯、易于传达且吸引人。不要使用任何工具。 确保遵守规则。规则:- 写作必须语法正确。- 尽可能少使用术语""")def edit():return dedent("""查找任何语法错误,进行编辑和格式化(如果需要)。在需要时为文本添加标题和副标题。不要缩短内容或添加评论。为内容创建一个合适的文件名,使用 .txt 扩展名。你必须使用工具将其保存到路径 ./lore/(你的标题.txt) 中。""")

这里的任务是你希望智能体执行的具体行动计划。

最后,创建 main.py 文件,我们将在这里组合智能体和任务,构建一个功能完备的团队。

from textwrap import dedentfrom crewai import Crew, Taskfrom agents import editor, idea_analyst, writer
from tasks import CreateTasksclass ContentWritingCrew():def __init__(self, idea):self.idea = ideadef __call__(self):tasks = self._create_tasks()crew = Crew(tasks=tasks,agents=[idea_analyst, writer, editor],verbose=True)result = crew.kickoff()return resultdef _create_tasks(self):idea = CreateTasks.expand_idea().format(idea=self.idea)expand_idea_task = Task(description=idea,agent = idea_analyst)write_task =  Task(description=CreateTasks.write(),agent=writer)edit_task = Task(description=CreateTasks.edit(),agent=editor)return [expand_idea_task, write_task, edit_task]if __name__ == "__main__":dir = "./lore"if not os.path.exists(dir):os.mkdir(dir)idea = input("idea: ")my_crew = ContentWritingCrew(idea=idea)result = my_crew()print(dedent(result))

在上述代码中,我们定义了一个名为 ContentWritingCrew 的类,它接受用户输入的创意主题。_create_tasks 方法用于创建任务,而 call 方法则用于初始化并启动团队。运行脚本后,你可以在终端或笔记本上观察到一系列动作的执行。任务将按照团队定义的顺序执行。以下是执行日志的一个示例。

这是最终智能体,即编辑器的执行日志。它编辑了撰稿人智能体提供的初稿,并使用文件编写工具以合适的文件名保存文件。

这就是使用 CrewAI 创建协作 AI 智能体的基本流程。你还可以结合其他 LangChain 工具或创建自定义工具,通过有效的提示来完成更复杂的任务。

六、AI智能体应用案例

自主 AI 智能体在现实生活中有着广泛的应用前景。从个人助理到虚拟教练,以下是一些 AI 智能体的实际应用案例。

个人 AI 助理:不久的将来,个人助理将成为我们日常生活的一部分。想象一下,有一个像 Jarvis 那样的智能助理,它能处理你的所有数据,实时提供有用的信息,并自动完成一些日常琐事。

代码解释器:OpenAI 的代码解释器展示了 AI 智能体的强大潜力。这个解释器能够执行任何 Python 脚本,并根据文本提示返回结果。这可能是迄今为止最成功的 AI 智能体应用之一。

虚拟教练:随着 AI 技术的不断进步,我们可以预见在教育、培训等领域将出现大量的虚拟教练。

智能体优先软件开发:AI 智能体在软件开发领域有着巨大的应用潜力。与传统的手动操作相比,AI 智能体能够根据语音指令自动完成各种任务。

空间计算:随着增强现实 (AR) 和虚拟现实 (VR) 技术的不断发展,AI 智能体将在虚拟世界与现实世界之间架起桥梁,发挥至关重要的作用。

七、总结

尽管我们仍处于 AI 智能体开发的初级阶段,但目前要实现 AI 智能体的最佳性能,我们还需要依赖于 GPT-4,这在成本上可能较为昂贵。然而,随着开源模型逐渐赶上 GPT-4,我们将有更多的选择,能够在合理的成本下高效运行 AI 智能体。同时,智能体开发的框架也在不断进步,未来将使智能体能够执行更加复杂的任务。

7.1、关键要点

  • AI 智能体利用大语言模型 (LLM) 的推理能力,选择适当的工具来完成复杂任务。
  • CrewAI 是一个构建协作 AI 智能体的开源框架。
  • CrewAI 的独特特性包括基于角色的智能体设计、智能体间的自主委托以及灵活的任务管理。
  • CrewAI 能够与现有的 LangChain 生态系统无缝集成,我们可以结合使用 LangChain 工具和大语言模型 (LLM) 与 CrewAI。

八、References

[1]. CrewAI GitHub:https://github.com/joaomdmoura/crewAI

[2]. Google GenAI:https://python.langchain.com/docs/integrations/llms/google_ai

[3]. Ollama:https://python.langchain.com/docs/integrations/llms/ollama

[4]. Tongyi Qwen:https://python.langchain.com/docs/integrations/llms/tongyi

[5]. Building AI Agents: https://www.analyticsvidhya.com/blog/2024/01/building-collaborative-ai-agents-with-crewai/

[6]. CrewAI Docs:https://docs.crewai.com/

[7]. CrewAI Examples:https://github.com/joaomdmoura/

 如何使用 CrewAI 构建协作型 AI Agents - 知乎

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/727905.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

片上网络(NoC)技术的发展及其给高端FPGA带来的优势

片上网络(NoC)技术的发展及其给高端FPGA带来的优势 1. 概述 在摩尔定律的推动下,集成电路工艺取得了高速发展,单位面积上的晶体管数量不断增加。 片上系统(System-on-Chip,SoC)具有集成度高、功耗低、成本低等优势,已经成为大规模集成电路系统设计的主流方向,解决了…

java017 - Java抽象类

1、概述 一般情况,动物是抽象的,所以不能被new,比如你在Animal类中定义一个成员方法eat,你不能定义具体内容,比如吃鱼或者吃白菜,因为动物是抽象的。 一个没有方法体的方法,应该定义为抽象方法,而类中如果…

I’m stuck!(CCF201312-5)解析(java实现)

代码 package test_201312;import java.util.Scanner;/** 201312-5 试题名称: I’m stuck! 时间限制: 1.0s 内存限制: 256.0MB 问题描述: 问题描述给定一个R行C列的地图,地图的每一个方格可能是#, , -, |, ., S, T七…

2024年最佳硬盘!为台式电脑、NAS等产品量身定做的顶级机械硬盘

机械硬盘(HDD)可能看起来像是古老的技术,但它们仍然在许多地方提供“足够好”的性能,并且它们很容易以同等的价格提供最多的存储空间。 尽管最好的SSD将为你的操作系统和引导驱动器提供最好的体验,并提供比HDD更好的应…

C++项目--高并发内存池

目录 一、项目介绍二、内存池介绍2.1 池化技术2.2 内存池2.3 内存池主要解决的问题2.4 malloc 三、定长内存池的实现3.1 定长内存池概念3.2 内存池管理释放对象3.3 内存池申请对象3.4 定长内存池整体代码3.5 性能对比 四、高并发内存池整体框架设计4.1 该项目解决的问题4.2 整体…

Pytorch学习 day06(torchvision中的datasets、dataloader)

torchvision的datasets 使用torchvision提供的数据集API,比较方便,如果在pycharm中下载很慢,可以URL链接到迅雷中进行下载(有些URL链接在源码里)代码如下: import torchvision # 导入 torchvision 库 # …

VM 虚拟机 ubuntu 解决无法连接网络问题

添加网卡法 就是在虚拟机的设置那里多增加一个网卡

如何度量关键成果KR的完成情况?

明确度量指标 首先,需要为每一个关键成果(Key Result)设定明确的度量指标。这些指标应该是具体、可衡量的,以便能够清晰地反映关键成果的完成情况。例如,如果关键成果是提高网站的用户转化率,那么度量指标…

论文阅读_解释大模型_语言模型表示空间和时间

英文名称: LANGUAGE MODELS REPRESENT SPACE AND TIME 中文名称: 语言模型表示空间和时间 链接: https://www.science.org/doi/full/10.1126/science.357.6358.1344 https://arxiv.org/abs/2310.02207 作者: Wes Gurnee & Max Tegmark 机构: 麻省理工学院 日期: 2023-10-03…

滑动窗口算法

前言 滑动窗口作为一个考点较高的算法,广泛应用于子串问题中,本文将进行详细讲解。 一、滑动窗口是什么 滑动窗口是双指针算法的一种,基本思路为维护一个窗口,然后从前往后遍历元素进行运算。 二、滑动窗口算法和其他双指针算法…

Unity Samples和帧动画的问题

拖动序列帧图片和自己创建clip的帧率不同 我今天在创建帧动画的时候用了两种方式第一种是直接拖动序列帧图片到Hierachy,然后生成的第二种是这样我发现两者播放的动画速率不一样最后查了半天查不到原因。最后发现是Samples的原因,而且Unity把Samples这个…

分类预测 | Matlab基于GWO-RBF灰狼算法优化径向基神经网络的分类预测

分类预测 | Matlab基于GWO-RBF灰狼算法优化径向基神经网络的分类预测 目录 分类预测 | Matlab基于GWO-RBF灰狼算法优化径向基神经网络的分类预测分类效果基本介绍程序设计参考资料 分类效果 基本介绍 Matlab基于GWO-RBF灰狼算法优化径向基神经网络的分类预测。基于灰狼算法(GWO…

记一次Flink任务无限期INITIALIZING排查过程

1.前言 环境:Flink-1.16.1,部署模式:Flink On YARN,现象:Flink程序能正常提交到 YARN,Job状态是 RUNNING,而 Task状态一直处于 INITIALIZING,如下图: 通过界面可以看到…

小火星露谷模组管理页面简介

1. 已有详细介绍的功能 模组管理页面部分功能已经有较为详细的介绍: 添加模组:https://svmbbs.smallfire.cn/d/15-dian-nao-zhong-yi-jing-you-duo-ge-mo-zu-ya-suo-wen-jian-ru-he-pi-liang-an-zhuang一键更新模组:https://svmbbs.smallfi…

python基础——入门必备知识

📝前言: 本文为专栏python入门基础的第一篇,主要带大家先初步学习一下python中的一些基本知识,认识,了解一下python中的一些专有名词,为日后的学习打下良好的基础,。本文主要讲解以下的python中的基本语法&…

苹果发布iOS17.4正式版升级,罕见带来一大波新功能!苹果数据备份软件 iOS系统管理软件 苹果数据备份到icloud iOS系统数据处理

近日,苹果发布了iOS17.4正式版,没想到的是居然有一大波新功能,如果你也是用iPhone的话,尤其是iPhone15新系列的,那么推荐你一定要升级下。下面让我给大家详细讲讲: 「电池健康」升级 电池设置界面得到了优…

数字孪生10个技术栈:原型设计,界面从无到有雏形的第一步。

一、什么是原型设计 可视化界面的原型设计是指在设计过程中创建一个低保真或高保真的可视化模型,以展示和演示最终产品的外观、布局和交互。它是设计师和开发团队在实际开发之前用来验证和确认设计方案的一个重要步骤。 可视化界面的原型设计主要包括以下几个方面&…

【OpenCV】仿 IOS 锁屏时钟

OpenCV 是一个开源的计算机视觉(Computer Vision)与机器学习软件库,提供了多种图像处理算法与接口。在图像处理中,按位运算是一类重要的运算,可以用于提取图像的重要部分。本文主要记录如何使用 OpenCV-Python 绘制仿 …

grid布局所有元素在同一行显示且等分列

目录 一、问题 二、实现方式 三、总结 tiips:如嫌繁琐,直接移步总结即可! 一、问题 1.grid布局可以通过 grid-template-columns来指定列的宽度。且可以通过repeat来指定重复的次数。但是现在的需求是:grid布局中元素的数量不确定&#…

一篇文章带你通关并查集(持续更新中)

这篇文章的所有题目均来自于自行整理,代码均来自于自行梳理调试(思路可能比较暴力)。初衷在于整理练习思路,且起到督促自己学习的作用 本文分成将三个模块 1.普及组 (洛谷黄题) 2.提高组 (洛…