AI大模型开发架构设计(1)——LLM大模型Agent剖析和应用案例实战

文章目录

    • LLM大模型Agent剖析和应用案例实战
      • 1 从 LLM 大模型到智能体演进技术
        • 语言模型是什么?
        • 大语音模型是什么?
        • 大语言模型日新月异
        • LLM大模型存在局限性
        • LLM Agent来势凶凶
        • LLM Agent增长迅猛
        • LLM Agent是什么?
      • 2 LLM Agent 架构深度剖析
        • 规划能力是什么?
        • 记忆能力是什么?
        • 工具使用能力是什么?
      • 3 LLM Agent 应用案例实战
        • Auto-GPT
        • 基于 LangChain 实现一个 Code Interpreter

LLM大模型Agent剖析和应用案例实战

1 从 LLM 大模型到智能体演进技术

语言模型是什么?
  • 语言模型:给定一些字或者词(称为 token),预测下一个字或者词的模型

image.png

大语音模型是什么?
  • 大语言模型(Large Language Model, LLM)是一类基于深度学习的语言模型,它们在大量的文本数据上进行训练,可以完成各种任务,包括代码编写、总结、翻译等。LLM 的特点是规模庞大,包含数十亿的参数,帮助它们语言数据中的复杂模式。

image.png

大语言模型日新月异

image.png

LLM大模型存在局限性
  • 简单的推理也会犯错?
  • 多聊几句就忘记历史信息了?
  • 写了代码能不能运行验证下?

image.png

LLM Agent来势凶凶

image.png

  • Agent = LLM(大语言模型,就好比人的大脑) + Plan(规划能力)+Memory(记忆能力)+Tools(工具使用能力)
LLM Agent增长迅猛

image.png

LLM Agent是什么?
  • LLM Agent 可以理解为一个以 LLM 为大脑的智能体(类比人),集成了规划、记忆、工具使用等能力。
    • 规划能力
      • 既然 LLM 难以直接处理复杂任务,一个直接的思想就是将任务进行拆解,通过实现几个小目标从而实现一个目标。此外,LLM Agent 可以对过去的行为自我批判和反思,从错误中吸取教训,并对未来的行为进行改进,从而提升最终的效果。
    • 记忆能力
      • 既然 LLM 的上下文有限,扩展其记忆能力肯定不可或缺。
    • 工具使用能力
      • 如果能够让 LLM 既能帮你写代码,还能帮你跑代码,那这样一个智能体的发挥空间就取决于你的想象力了。

LLM Agent 可以理解为一个以 LLM 为大脑的智能体(类比人),集成了规划、记忆、工具使用等能力。

image.png

2 LLM Agent 架构深度剖析

规划能力是什么?
  • 规划能力,本质上希望激发 LLM 的最大潜能,“引导”或者“提示” LLM 更好地回答问题,因为规划能力很大一部分还在 Prompt Engineering 上。

【方式一】任务拆解

  • 就是把任务分成一步一步来执行,一步一步像一条链吗?——CoT 思维链

image.png

CoT任务拆解的缺陷是什么?

  • 链式任务拆解方式可能忽略一些潜在情况,因为一步之后只能选择往下一步,没有多种选择余地。

image.png

任务拆解三种方式

  • 让 LLM 自己来拆解,比如前面的 ToT Prompt,还有常见的拆解 Prompt,“Step for XYZ”等
  • 任务相关的引导,比如写小说,可以让 LLM 写一个小说的大纲 “Write a story outline.”
  • 用户自己分解任务,类似 CoT,自己写出满意的步骤再让 LLM 来模仿

LLM和传统规划方式结合

image.png

【方式二】自我反思

  • 当我做事情时,做对或者做错都会让我们思考怎么做得更好
  • 从 Agent 的角度出发,接收一个观测(Observation),给出一个动作(Action)(强化学习的感觉)

image.png

  • 告诉 LLM 应该按照“思考-行动-观测”的方式来获得最终的回答
    • few-shot Learning + 提供 thought

举个🌰

image.png

记忆能力是什么?

LLM的记忆是什么?

  • 训练数据 -> 模型参数(fixed) —— 长期记忆
  • 上下文提示(Context),我们喂给 LLM 信息的地方—— 短期记忆
    • 记忆容量(上下文长度)有限,“按需投喂”:先存后取

LLM + 向量数据库

  • -> 向量数据库的核心思想是将文本转换成向量(Embedding),然后将向量存储在数据库中。
  • -> 讲用户输入的问题转成向量,然后在数据库中国检索最相似的向量,以及向量对应的文本(记
    忆),返回给 LLM,生成回答。

image.png

举个🌰

image.png

当“记忆”非常多时,如何在大量“记忆”力快速找到最相关的那些“记忆”?

  • 近似最近邻(Approximate Nearest Neighbor)
    • 牺牲了精度,换取了速度
    • ANN 多种实现:局部敏感哈希、乘积量化等
    • 核心思想通过某种方式,将数据的特征压缩或分组,在搜索时,只需在部分数据中寻找最近邻
      在这里插入图片描述
工具使用能力是什么?

工具使用能力

  • 巧妇难为无米之炊,仅靠 LLM 自身能做的事情还是比较有限,比如:LLM 可以帮忙写代码,但是无法执行代码,因此要让 LLM 能做更多事情,就需要借它点工具。

image.png

工具使用能力-function calling

  • 开发者定义一个第三方函数(自定义工具)
  • 调用 OpenAPI 时,把第三方函数作为参数传给 LLM
  • LLM 判断何时需要调用第三方函数(注意:LLM 只是判断,然后由开发者来执行)
  • 开发者调用第三方函数后,要把返回值传给模型(再次调用 OpenAI API)
  • 此时 LLM 的返回值则是最终的回答

image.png

工具使用能力-HuggingGPT

  • 理解用户自然语言指令,并计划分配任务
  • 根据 Hugging Face 上的模型描述,选择合适的工具(AI 模型)
  • 调用 AI 模型执行子任务
  • 整合结果并返回结果

image.png

3 LLM Agent 应用案例实战

Auto-GPT
  • Auto-GPT 是一个开源的实验性项目,它算是 LLM Agent 的一个标准雏形了,包括前面提前的各种能力(规划、记忆、使用工具),可以根据用户的目标让 GPT-4 实现完全自主运行。

image.png

  • Auto-GPT 的效果很大程度上归功于它复杂的 Prompt 工程,主要包含几个部分:

    • 需要设定交给 Auto-GPT 完成的目标
    • 调用 API 花费的预算
    • 一些 LLM 需要遵守的规则(约束)
    • 可以调用的工具(API)
    • 返回需要格式

image.png

Auto-GPT 的输出

image.png

  • 可以看出,这里既有任务拆解,也有反思,同时还具有调用外部工具的能力,而记忆能力(向量数据库)虽然这里不能直接体现出来,但是 Auto-GPT 也是具备的。

Auto-GPT 的主要框架设计

image.png

  • 可以看出,创建一个初始的计划,然后进入主循环。系统会让模型判断在当前计划下该进行何种行动,接着会执行行动。执行完毕后,结果会写入下一次循环中。如此,每次决策都会基于之前的结果、记忆和计划,从而制定出新的行动方案。
基于 LangChain 实现一个 Code Interpreter
  • LLM Agent 技术架构设计和应用实现——对于 IT人来说是一项非常重要的技能,它可以让您的 LLM 业务研发更高效和创新。

image.png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/638620.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

OpenCV实战——OpenCV.js介绍

OpenCV实战——OpenCV.js介绍 0. 前言1. OpenCV.js 简介2. 网页编写3. 调用 OpenCV.js 库4. 完整代码相关链接 0. 前言 本节介绍如何使用 JavaScript 通过 OpenCV 开发计算机视觉算法。在 OpenCV.js 之前,如果想要在 Web 上执行一些计算机视觉任务,必须…

线性代数:矩阵运算(加减、数乘、乘法、幂、除、转置)

目录 加减 数乘 矩阵与矩阵相乘 矩阵的幂 矩阵转置 方阵的行列式 方阵的行列式,证明:|AB| |A| |B| 加减 数乘 矩阵与矩阵相乘 矩阵的幂 矩阵转置 方阵的行列式 方阵的行列式,证明:|AB| |A| |B|

核密度曲线(python

目录 1.代码:2.效果:小结: 1.代码: import pandas as pd import matplotlib.pyplot as plt # 读入数据 file r123.xlsx sheet Sheet2 col S213 # 标题名称 title col 供订比曲线 xlabel 供订比 # 横轴显示范围 xleft 0 xr…

解决 conda新建虚拟环境只有一个conda-meta文件&conda新建虚拟环境不干净

像以前一样通过conda 新建虚拟环境时发现环境一团糟,首先新建虚拟环境 conda create -n newenv这时候activate newenv,通过pip list,会发现有很多很多的包,都是我在其他环境用到的。但诡异的是,来到anaconda下env的目…

加固密码安全:保护您的个人信息

一、引言 在数字化时代,密码安全是保护个人信息和数据的重要环节。然而,许多人在创建和管理密码时存在一些常见的安全漏洞,如使用弱密码、重复使用密码等。本文将详细介绍密码安全的重要性,并提供一些有效的方法和技巧&#xff0…

【嘉立创EDA-PCB设计指南】4.模块化布局

前言:本文对本专栏中的【嘉立创EDA-PCB设计指南】前面绘制的原理图进行模块化布局,首先进行预布局(将每个模块放一起),然后进行精细化布局(按照原理图来精细化布局)。 目录 模块化预布局 模块…

软件工程应用题汇总

绘制数据流图(L0/L1/L2) DFD/L0(基本系统模型) 只包含源点终点和一个处理(XXX系统) DFD/L1(功能级数据流图)在L0基础上进一步划分处理(XXX系统) 个人理解 DFD/L2(在L1基础上进一步分解后的数据流图) 数据…

NumPy2要来了,但先别急!

B站:啥都会一点的研究生公众号:啥都会一点的研究生 如果你正在使用 Python 编写代码,那么很有可能正在直接或间接地使用 NumPy 如Pandas、Scikit-Image、SciPy、Scikit-Learn、AstroPy…这些都依赖于 NumPy NumPy 2 是一个新的重要版本&am…

XXE漏洞概念

1、XXE漏洞概念 XXE(XML External Entity Injection) 又称为XML外部实体注入。 XML是一种类似于HTML(超文本标记语言)的可扩展标记语言,是用于标记电子文件使其具有结构性的标记语言,可以用来标记数据、定义数据类型&#xff0c…

响应式Web开发项目教程(HTML5+CSS3+Bootstrap)第2版 例4-7 datalist

代码 <!doctype html> <html> <head> <meta charset"utf-8"> <title>datalist</title> </head><body> <input id"address" list"addressList"> <datalist id"addressList"…

Web3艺术市场:NFT与数字创作的结合

在数字时代&#xff0c;随着区块链技术的崛起&#xff0c;一种新型数字资产&#xff0c;非同质化代币&#xff08;NFT&#xff09;&#xff0c;正逐渐改变传统艺术市场的格局。这种数字化的艺术品售卖方式成为了Web3艺术市场的代表&#xff0c;推动着数字创作与艺术市场的结合。…

【C++干货铺】C++11新特性——右值引用、移动构造、完美转发

个人主页点击直达&#xff1a;小白不是程序媛 C系列专栏&#xff1a;C干货铺 代码仓库&#xff1a;Gitee 目录 左值与左值引用 右值与右值引用 左值引用和右值引用的比较 左值引用总结&#xff1a; 右值引用总结&#xff1a; 左值引用的作用和意义 右值引用的使用场景和…

C++ 学习系列 -- std::function 与 std::bind

一 std::function 与 std::bind 的介绍 1. std::function std::function 是 c 11 的新特性 &#xff0c;包含在头文件<functional>中&#xff0c;为了更方便的调用函数而引入。 std::function 是一个函数包装器&#xff08;function wrapper&#xff09;&#xff0c;…

CHAPTER 11: 《DESIGN A NEWS FEED SYSTEM》 第 11 章:《设计新闻系统》

在本章中&#xff0c;您将被要求设计一个新闻提要系统。什幺是新闻系统&#xff1f;根据Facebook 页面&#xff0c;“News feed 是中间不断更新的故事列表。您的主页。动态消息包括状态更新、照片、视频、链接、应用活动记录和喜欢您在 Facebook 上关注的人、页面和群组“[1]。…

Mysql运维篇(三) MySQL数据库分库分表方案

一路走来&#xff0c;所有遇到的人&#xff0c;帮助过我的、伤害过我的都是朋友&#xff0c;没有一个是敌人&#xff0c;如有侵权请留言&#xff0c;我及时删除。 一、前言 关系型数据库本身比较容易成为系统瓶颈&#xff0c;单机存储容量、连接数、处理能力都有限。当单表的数…

磁盘的分区与文件系统的认识

磁盘的认识 了解磁盘的结构&#xff1a; 1、盘片 硬盘首先会有多个盘片构成&#xff0c;类似很多个独立的光盘合并在一起&#xff0c;每个盘片都有2个面&#xff0c;每个盘片都有一个对应的磁头&#xff0c;我们的磁头横移和盘面的旋转就可以读写到盘面的每一个位置&#xff0c…

08. 面向对象编程(二)

目录 1、前言 2、多重继承 2.1、潜在的问题 3、Property 4、staticmethod 5、运算符重载 5.1、加法运算符 的重载 5.2、字符串表示运算符 str() 的重载 5.3、索引运算符 [] 的重载 6、小结 1、前言 上一篇文章中&#xff0c;我们介绍了面向对象编程的类和实例&…

v35-36.problems

1.size of&#xff08;&#xff09;运算符 根据c语言标准规范&#xff0c;Size of&#xff08;&#xff09; 里面的操作数如果不是可变长度数组类型 &#xff0c;那么此操作数就不会被执行 &#xff01;

x-cmd pkg | skate - 个人键值对存储工具

目录 简介用户首次快速实验指南功能特点竞品和相关作品进一步探索 简介 skate 是个人键值对存储工具&#xff0c;具备数据加密、云端数据备份以及多设备同步等功能。 它由 Charm 团队开发&#xff0c;借用 Charm Cloud 向用户提供一种快捷的方式来保存和检索各种数据&#xf…

零基础学习【Linux】这一篇就够了

Linux学习目录 1. Linux简介1-1. Linux系统版本 2. Linux安装2-1. 安装方式2-2. Vmware安装2-3. Linux安装2-4. Vmware克隆2-5. Vmware快照2-6. 连接工具安装 3. Linux常用命令4. Linux软件安装5. 项目部署 1. Linux简介 1-1. Linux系统版本 Linux系统分为内核版和发行版 内核…