本次课程由Lagent&AgentLego 核心贡献者樊奇老师讲解【Lagent & AgentLego 智能体应用搭建】课程
课程视频:https://www.bilibili.com/video/BV1Xt4217728/
课程文档:https://github.com/InternLM/Tutorial/tree/camp2/agent
大语言模型的局限性:
- 幻觉,模型可能会生成虚假信息,与现实严重不符或脱节。如问“鲁迅和周树人是同一个人吗?”,模型回答"鲁迅和周树人不是同一个人。"
- 时效性, 模型训练数据过时,无法反映最新趋势和信息。如问"今年是哪一年?",模型回答"今年是2023年"
- 可靠性,面对复杂任务时,可能频发错误输出现象,影响信任度。如问"你能帮我写一段微调 LLM 的代码吗?",模型回答"def train0:return 'Hello World"
智能体:
- 可以感知环境中的动态条件。
- 能采取动作影响环境。
- 能运用推理能力理解信息、解决问题、产生推断、决定动作。
智能体组成:
- 大脑:作为控制器,承担记忆、思考和决策任务。接受来自感知模块的信息,并采取相应动作。
- 感知:对外部环境的多模态信息进行感知和处理。包括但不限于图像、音频、视频、传感器等。
- 动作:利用并执行工具以影响环境。工具可能包括文本的检索、调用相关 API、操控机械臂等。
智能体范式:
AutoGPT:https://github.com/Significant-Gravitas/AutoGPT
ReWoo:ReWOO:Decoupling Reasoning from Observations for Efficient Augmented Language Models
ReAct :REACT: SYNERGIZING REASONING AND ACTING IN LANGUAGE MODELS
Lagent 是一个轻量级开源智能体框架,旨在让用户可以高效地构建基于大语言模型的智能体。同时它也提供了一些典型工具以增强大语言模型的能力。
Lagent 目前已经支持了包括 AutoGPT、ReAct 等在内的多个经典智能体范式,也支持了如下工具:
- Arxiv 搜索
- Bing 地图
- Google 学术搜索
- Google 搜索
- 交互式 IPython 解释器
- IPython 解释器
- PPT
- Python 解释器
AgentLego 是一个提供了多种开源工具 API 的多模态工具包,旨在像是乐高积木一样,让用户可以快速简便地拓展自定义工具,从而组装出自己的智能体。通过 AgentLego 算法库,不仅可以直接使用多种工具,也可以利用这些工具,在相关智能体框架(如 Lagent,Transformers Agent 等)的帮助下,快速构建可以增强大语言模型能力的智能体。
两者的关系 : Lagent 是一个智能体框架,而 AgentLego 与大模型智能体并不直接相关,而是作为工具包,在相关智能体的功能支持模块发挥作用。