【InternLM实战营---第六节课笔记】

一、本期课程内容概述

本节课的主讲老师是【樊奇】。教学内容主要包括以下三个部分:
1.大模型智能体的背景及介绍
2. Lagent&AgentLego框架介绍
3.Lagent&AgentLego框架实战

二、学习收获

  1. 智能体出现的背景
    智能体的引入旨在克服大模型在应对复杂、动态任务时的局限性,主要体现在以下三个方面:
    • 减少幻觉: 智能体利用知识图谱、符号推理或交互式学习,增强对输入信息的理解与推理,降低生成与事实不符或逻辑混乱输出的风险。
    • 提升时效性: 智能体具备在线学习和实时适应环境变化的能力,能快速吸收新知识、响应新事件,确保决策紧跟时代步伐。
    • 增强可靠性: 通过提高可解释性、确保决策一致性及优化泛化能力,智能体在高风险场景中提供更为可信的服务。
  2. 大语言模型智能体
    大语言模型智能体(Language Model-based Intelligent Agent)是一种先进的复合型人工智能系统,它结合了大语言模型的强大自然语言处理能力和智能体的自主行为决策机制,能够在特定环境中感知动态条件、采取有目的的动作以影响环境,并运用强大的推理能力来理解信息、解决复杂问题、产生合理推断以及据此作出行动决策。
    • 感知环境中的动态条件: 大语言模型智能体具备实时或近实时的环境感知能力,能够通过各种输入接口(如文本、语音、图像等,经由相应的传感器或数据接口转化成文本描述)来捕捉环境中的关键信息和动态变化。这种感知能力不仅包括对当前状态的识别,还涵盖对环境趋势、潜在风险、机会点等复杂情况的理解。大语言模型在此过程中扮演着解析、理解和语义建模的角色,将非结构化或半结构化的感知数据转化为可操作的知识表示,使智能体能够准确理解其所在环境的状态及其演化。

    • 采取动作影响环境: 智能体的核心特征之一是其行动能力,即根据对环境的感知和内部目标导向,采取具体的操作或决策来改变或响应环境。大语言模型智能体能够利用其生成能力,制定清晰、有针对性的指令、建议或交互话语,通过输出接口传达给外部系统或直接与人进行沟通,从而引导或直接影响环境的变化。这些动作可以是执行物理任务(、进行信息检索和传递、调整系统设置、参与社交互动等。大语言模型在此过程中提供语言生成支持,确保智能体所采取的动作以恰当、有效且符合语境的方式表达和执行。

    • 深度推理: 大语言模型智能体的核心智力来源于其内置的大语言模型组件,这类模型经过大规模数据训练,拥有强大的上下文理解、逻辑推理、常识推理和联想思维能力。它们能够:

      • 理解信息:快速消化大量文本输入,准确提取关键信息,理解其中的隐含意义、情感色彩、专业术语等复杂语义元素。
      • 解决问题:面对复杂问题,智能体能运用推理能力分析问题结构,调用相关知识,模拟可能的解决方案路径,甚至进行多步骤推理以达到问题解决的目的。
      • 产生推断:基于现有信息和背景知识,大语言模型智能体能够进行逻辑推理、类比推理、因果推理等,生成关于未来事件可能性、未知变量估计、情境假设等方面的合理推断。
      • 决定动作:在理解信息、解决问题和产生推断的基础上,智能体能够根据其内在目标函数、环境约束、伦理规范等因素,综合评估各种可能的行动选项,选择最有利于达成目标或优化环境状态的行动方案。
  3. 智能体范式
    智能体范式
  4. Lagent框架
    Lagent 是一个轻量级开源智能体框架,旨在让用户可以高效地构建基于大语言模型的智能体。同时它也提供了一些典型工具以增强大语言模型的能力。整个框架如下所示:
    框架图
    Lagent由三个主要部分组成,agents,llms和actions:
    • agents:提供代理实现,如ReAct、AutoGPT等。
    • llms:支持各种大型语言模型,包括通过HuggingFace模型的开源模型(Llama-2,InterLM)或GPT3.5/4等闭源模型。
    • actions:包含一系列的action,以及一个action executor来管理所有的action。Agent Lego
  5. Agent Lego框架
    Agent Lego 是一个开源的多功能工具 API 库,用于扩展和增强基于大型语言模型(LLM)的智能体(Agent),具有以下突出特点:
    • 丰富的多模态扩展工具集,包括视觉感知、图像生成和编辑、语音处理和视觉语言推理等。
    • 灵活的工具接口,允许用户轻松扩展具有任意类型参数和输出的自定义工具。
    • 与基于LLM的代理程序框架轻松集成,如 LangChain、Transformers Agent、Lagent。
    • 支持部署工具服务和远程访问,这对于需要大型机器学习模型(例如 ViT)或特殊环境(例如 GPU 和 CUDA)的工具特别有用。
      AgentLego 目前提供了如下工具:
      工具

三、个人体会

  • AgentLego提供的工具是真不少呀,希望自己也能够开发属于自己的智能体

四、本期作业

https://blog.csdn.net/weixin_45609124/article/details/138097181

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/2634.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【设计模式】使用中介者模式优化表单交互

我们想象一下机场的指挥塔,如果没有指挥塔的存在,每一架飞机要和方圆 100 公里内的所有飞机通信,才能确定航线以及飞行状况,后果是不可想象的。现实中的情况是,每架飞机都只需要和指挥塔通信。指挥塔作为调停者&#x…

93页 | 数据中台标准技术体系方案(免费下载)

【1】关注本公众号,转发当前文章到微信朋友圈 【2】私信发送 数据中台标准技术体系方案 【3】获取本方案PDF下载链接,直接下载即可。 如需下载本方案PPT原格式,请加入微信扫描以下方案驿站知识星球,获取上万份PPT解决方案&#…

文件上传漏洞-白名单检测

如何确认是否是白名单检测 上传一张图片与上传一个自己构造的后缀,如果只能上传图片不能上传其它后缀文件,说明是白名单检测。 绕过技巧 可以利用 00 截断的方式进行绕过,包括 %00 截断与 0x00 截断。除此之外如果网站存在文件包含漏洞&…

ElasticSearch总结二

正向索引和倒排索引: 正向索引: 比方说我这里有一张数据库表,那我们知道对于数据库它一般情况下都会基于i d去创建一个索引,然后形成一个b树。 那么你根据i d进行检索的速度,就会非常的快,那么这种方式的…

智慧水生态系统的架构设计与优化:内蒙古硕达智水百数低代码平台的实践

随着业务的不断扩展,传统的项目管理方式已无法满足现代水生态项目的需求。为提高项目管理和决策效率,内蒙古硕达智水生态科技决定引入百数作为其数字化转型的合作伙伴。 内蒙古硕达智水生态科技有限公司: 内蒙古硕达智水生态科技有限公司&a…

用于割草机器人,商用服务型机器人的陀螺仪

介绍一款EPSON推出适用于割草机器人,商用服务型机器人的高精度陀螺仪模组GGPM61,具体型号为GGPM61-C01。模组GGPM61是一款基于QMEMS传感器的低成本航向角输出的传感器模组,它可以输出加速度、角速度及姿态角等信息,为控制机器人运…

人工智能基础-Python之Pandas库教程

文章目录 前言一、Pandas是什么?二、使用步骤1.引入库2.数据读取2.1 数据类型2.2 数据读取1.常见操作2.txt读取 3.pandas的数据结构3.1 Series1.属性2.创建Series3.查询 3.2 DataFrame1.创建DataFrame 4.查询数据4.1 data.loc 根据行列标签值进行查询1.使用单个labe…

ASP.NET Core 3 高级编程(第8版) 学习笔记 04

第 19 章主要介绍 Restful Service 的相关知识。Restful Service 的核心内容是:(1)HTTP 请求或 HTTP 动词,用 HTTP 请求表达不同的操作,最好遵守惯例。(2)资源,通过 PATH 结合 paylo…

stm32f4单片机强制类型转换为float程序跑飞问题

如题,在一个数据解析函数中使用了*(float *)&data[offset],其中data为uint8类型指针,指向的value地址为 可以看到地址0x20013A31非对齐,最终在执行VLDR指令时导致跑飞 VLDR需要使用对齐访问 跑飞后查看SCB寄存器发现确实是非…

【网络安全】在网络中如何对报文和发送实体进行鉴别?

目录 1、报文鉴别 (1)使用数字签名进行鉴别 (2)密码散列函数 (3)报文鉴别码 2、实体鉴别 鉴别(authentication) 是网络安全中一个很重要的问题。 一是要鉴别发信者,即验证通信的对方的确是…

微博评论爬取

import requests import csv# 打开CSV文件以写入数据 f open(data.csv, modea, encodingutf-8-sig, newline) csv_writer csv.DictWriter(f, fieldnames[昵称, 性别, 归属地, 内容]) csv_writer.writeheader()# 定义一个函数用于获取评论内容 def GetContent(max_id):# 设置请…

【Harmony3.1/4.0】笔记五

概念 本文综合row,column作为主要布局,结合image组件,text组件,textimput组件,button组件以及轮播布局搭建登录页面 效果图 ArkTS代码 //登录综合页面 Entry Component struct Five{//添加图片State imgs:Resource[…

企业有哪些常见网络需求场景?

企业的网络场景需求多种多样,主要取决于其业务规模、运营模式、技术应用等因素。 常见的企业网络场景需求 办公网络需求: 高速稳定的内部网络连接,以支持员工日常办公、数据传输和资源共享。 无线办公网络覆盖,以便员工在会议室…

【LeetCode刷题记录】19. 删除链表的倒数第 N 个结点

19 删除链表的倒数第 N 个结点 给你一个链表,删除链表的倒数第 n 个结点,并且返回链表的头结点。 示例 1: 输入:head [1,2,3,4,5], n 2 输出:[1,2,3,5] 示例 2: 输入:head [1], n 1 输出…

大模型的实践应用22-谷歌Gemma AI大模型的架构原理,以及Gemma模型的部署安装本地教程

大家好,我是微学AI,今天给大家介绍一下大模型的实践应用22-谷歌Gemma AI大模型的架构原理,以及Gemma模型的部署安装本地教程。谷歌Gemma AI大模型是由Google AI团队开发并开源。Gemma模型采用Transformer编码器-解码器架构,并加入了一些改进,例如使用稀疏注意力机制来提高推…

世媒讯提供海内外媒体宣发服务,引领企业新媒体发展之路

在这个信息化的时代,软文发稿已经成为企业发展不可或缺的重要工具。随着社会的快速发展,消费者需要更多定制化、个性化的信息。利用软性推广,凭借其细致入微的信息传递,可以迅速抓住消费者的注意力,从而进一步推动企业…

“五之链”第十六期沙龙活动在呆马科技成功举办

2024年4月19日,由临沂呆码区块链网络科技有限公司(呆马科技)承办的第十六期“五之链”物流主题沙龙活动成功举办。此次活动邀请了政府相关部门、知名科研院所、物流企业等20余家单位参与,共同探讨物流数据要素流通与智能应用的发展…

使用prompt_toolkit构建交互式命令行工具

prompt_toolkit是一个python库,用于构建命令行工具和终端应用。其官网介绍如下, prompt_toolkit is a library for building powerful interactive command line and terminal applications in Python. 安装命令如下, pip install prompt_to…

朴素贝叶斯算法分类

def loadDataSet():postingList[[my, dog, has, flea, problems, help, please], #切分的词条[maybe, not, take, him, to, dog, park, stupid],[my, dalmation, is, so, cute, I, love, him],[stop, posting, stupid, worthless, garbage],[mr, licks, ate, my, steak, …

HarmonyOS开发案例:【相机开发】

基本概念 相机是OpenHarmony多媒体进程提供的服务之一,提供了相机的录像、预览、拍照功能,支持多用户并发取流。 在进行应用的开发前,开发者应了解以下基本概念: 视频帧 视频流指的是将一系列图片数据按照固定时间间隔排列形成的…