AI agents系列之全面介绍

随着大型语言模型(LLMs)的出现,人工智能(AI)取得了巨大的飞跃。这些强大的系统彻底改变了自然语言处理,但当它们与代理能力结合时,才真正释放出潜力——能够自主地推理、规划和行动。这就是LLM代理大显身手的地方,它们代表了我们与AI交互以及利用AI的方式的范式转变。

None

来源:letta

这篇博客旨在全面介绍AI代理,深入探讨它们的特征、组件和类型,同时探索它们的演变、挑战和潜在的未来方向。

文章目录

      • 1. 从LLM到AI代理
        • 1.1 传统聊天机器人到LLM驱动的聊天机器人
        • **1.2 LLM驱动聊天机器人的引入**
        • 1.3 从LLM驱动的聊天机器人到RAG聊天机器人和AI代理
      • 2. 什么是AI代理?
        • 2.1 AI代理的特征
      • 3. AI代理的核心组件
        • 3.1 感知(传感器)
        • 3.2 推理(处理器)
        • 3.3 行动(执行器)
        • 3.4 知识库
        • 3.5 学习
        • 3.6 通信接口
      • 4. **AI代理如何与环境交互**
        • 4.1 感知阶段
        • 4.2 决策阶段
        • 4.3 行动阶段
      • 5. AI代理是如何工作的?
        • 5.1 协调层(控制中心)
        • 5.2 模型(大脑)
        • 5.3 工具(双手)
      • 6. ✅ 何时使用代理 / ⛔ 何时避免使用
      • 7. 应用领域
      • 8. 结论

让我们先了解一下从LLM到AI代理的演变过程。

1. 从LLM到AI代理

LLM应用形式的演变是我们所见过的现代应用中发展最快的之一。

None

来源:mongodb

1.1 传统聊天机器人到LLM驱动的聊天机器人

聊天机器人并不是什么新鲜事物;在生成式AI(Gen AI)这个术语出现之前,你可能就已经在网站上与聊天机器人互动过了。传统聊天机器人与今天的AI驱动的对话代理有着根本的不同。它们通常是这样工作的:

基于启发式的响应:

  • 传统聊天机器人基于规则逻辑(“如果-那么”语句)运行。
  • 仅限于预定义的规则,无法处理复杂或模糊的查询。

固定响应:

  • 响应是静态的、预定义的。
  • 通过检测特定的关键词或短语来触发。
  • 缺乏灵活性和对话深度。

转接人工:

  • 总是有一个“与人工对话”的按钮,用于处理未解决的查询。
  • 人工干预对于处理复杂问题仍然至关重要。

None

来源:mongodb

1.2 LLM驱动聊天机器人的引入

ChatGPT的推出: 2022年11月30日,OpenAI推出了ChatGPT,它由GPT-3.5驱动,是第一个主流的LLM应用。ChatGPT保留了熟悉的聊天机器人界面,但背后是经过大量互联网语料库训练的先进LLM技术。

Transformer架构: GPT(生成式预训练Transformer)基于谷歌在2017年引入的Transformer架构。它使用自注意力机制来分析输入序列,更深入地理解上下文。

LLM的能力: 与传统聊天机器人不同,LLM可以生成类似人类、与上下文相关且新颖的文本。用例包括代码生成、内容创作、增强客户服务等。

局限性:

  • 个性化: 在长时间的对话中难以保持一致的个性化互动。
  • 幻觉: 可以产生在事实上不正确但连贯的响应,基于概率而非经过验证的知识生成输出。

解决局限性的方法:

  • 探索像**检索增强生成(RAG)**这样的技术,以使输出基于可靠的外部数据。
  • 这些进步旨在减少不准确之处,提高LLM驱动系统的稳健性。
1.3 从LLM驱动的聊天机器人到RAG聊天机器人和AI代理

RAG聊天机器人: 检索增强生成(RAG)将外部数据检索与LLM能力相结合,以产生准确且基于上下文的响应。

知识来源:

  • 非参数化知识: 从互联网或专有数据库等外部来源实时检索的数据。
  • 参数化知识: LLM训练中嵌入的知识。

优势: 减少幻觉,提供最新的信息,并确保可验证的响应。

提示工程: 通过引导LLM的推理和输出生成,像上下文学习(单次、少量)、思维链(CoT)和ReAct等技术提高了响应质量。

None

来源:mongodb

AI代理: AI代理是从具有工具、多步规划和推理能力的LLM演变而来的。

工具使用: LLM可以通过分析任务并通过结构化模式(例如JSON)分配参数,调用程序定义的函数或API。

环境: AI代理在迭代执行环境中运行,能够根据反馈进行动态决策和持续适应。

代理系统: 这些是具有自主代理的计算架构,能够集成多个系统组件、做出决策并实现目标。

代理式RAG:

  • 将LLM的推理、工具使用和规划能力与语义信息检索相结合。
  • 能够
    分解任务、执行复杂查询并利用工具解决问题的动态系统。

None

来源:mongodb

从LLM驱动的聊天机器人到RAG聊天机器人和AI代理的转变,代表了向更智能、更适应性强且能够实时解决复杂问题的工具集成系统的转变。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/76776.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

如何使用AI辅助开发CSS3 - 通义灵码功能全解析

一、引言 CSS3 作为最新的 CSS 标准,引入了众多新特性,如弹性布局、网格布局等,极大地丰富了网页样式的设计能力。然而,CSS3 的样式规则繁多,记忆所有规则对于开发者来说几乎是不可能的任务。在实际开发中&#xff0c…

复刻系列-星穹铁道 3.2 版本先行展示页

复刻星穹铁道 3.2 版本先行展示页 0. 视频 手搓~星穹铁道~展示页~~~ 1. 基本信息 作者: 啊是特嗷桃系列: 复刻系列官方的网站: 《崩坏:星穹铁道》3.2版本「走过安眠地的花丛」专题展示页现已上线复刻的网…

爬虫:IP代理

什么是代理 代理服务器 代理服务器的作用 就是用来转发请求和响应 在爬虫中为何需要使用代理? 有些时候,需要对网站服务器发起高频的请求,网站的服务器会检测到这样的异常现象,则会讲请求对应机器的ip地址加入黑名单&#xff…

协程的原生挂起与恢复机制

目录 🔍 一、从开发者视角看协程挂起与恢复 🧠 二、协程挂起和恢复的机制原理:核心关键词 ✅ suspend 函数 ≠ 普通函数 ✅ Continuation(协程的控制器) 🔧 三、编译器做了什么?&#xff0…

c++11--std::forwaord--完美转发

std::forword的作用 完美转发的核心目的是保持参数的原始类型(包括const/volatile限定符和左值/右值性质)不变地传递给其他函数。 为什么需要完美转发 在没有完美转发之前,我们面临以下问题: 模板参数传递中的值类别丢失 当参数…

Linux安装开源版MQTT Broker——EMQX服务器环境从零到一的详细搭建教程

零、EMQX各个版本的区别 EMQX各个版本的功能对比详情https://docs.emqx.com/zh/emqx/latest/getting-started/feature-comparison.html

计算机组成原理-存储器

1. 存储器的定义与作用 存储器是计算机系统中用于存储程序、数据和中间结果的硬件设备,是计算机五大核心部件之一。 核心功能: 提供数据的 临时或永久存储 能力。支持CPU按需快速存取指令和数据,是程序运行的物理基础。 2. 存储器的分类 …

单片机领域中哈希表

以下是单片机领域中哈希表的实际应用及编程实例: 1.哈希表在单片机中的实际应用场景 • 命令解析:在单片机通信中,经常需要解析接收到的命令。使用哈希表可以快速地将命令字符串映射到对应的处理函数,提高命令解析的效率。 • 数…

算法思想之位运算(一)

欢迎拜访:雾里看山-CSDN博客 本篇主题:算法思想之位运算(一) 发布时间:2025.4.12 隶属专栏:算法 目录 滑动窗口算法介绍六大基础位运算符常用模板总结 例题位1的个数题目链接题目描述算法思路代码实现 比特位计数题目链接题目描述…

封装Tcp Socket

封装Tcp Socket 0. 前言1. Socket.hpp2. 简单的使用介绍 0. 前言 本文中用到的Log.hpp在笔者的历史文章中都有涉及,这里就不再粘贴源码了,学习地址如下:https://blog.csdn.net/weixin_73870552/article/details/145434855?spm1001.2014.3001…

全星APQP软件:为用户提供高效、合规、便捷的研发管理体验

全星APQP软件:为用户提供高效、合规、便捷的研发管理体验 为什么选择全星APQP软件系统? 在汽车及高端制造行业,研发项目管理涉及APQP(先期产品质量策划)、FMEA(失效模式与影响分析)、CP&#x…

CTF--网站被黑

一、原题: (1)提示:网站被黑了 黑客会不会留下后门 (2)原网页: 二、步骤: 1.在终端扫描网址: 2.扫描后发现:shell.php 3.输入网址:http://117.…

入门到精通,C语言十大经典程序

以下是十个经典的C语言程序示例&#xff0c;这些程序涵盖了从基础到稍复杂的应用场景&#xff0c;适合初学者和有一定基础的开发者学习和参考。 1. Hello, World! 这是每个初学者学习编程时的第一个程序&#xff0c;用于验证开发环境是否正确配置。 #include <stdio.h>…

神经网络入门—自定义神经网络续集

修改网络 神经网络入门—自定义网络-CSDN博客 修改数据集&#xff0c;yx^2 # 生成一些示例数据 x_train torch.tensor([[1.0], [2.0], [3.0], [4.0]], dtypetorch.float32) y_train torch.tensor([[1.0], [4.0], [9.0], [16.0]], dtypetorch.float32) 将预测代码改为&…

【browser-use+deepseek】实现简单的web-ui自动化

browser-use Web-UI 一、browser-use是什么 Browser Use 是一款开源Python库&#xff0c;专为大语言模型设计的智能浏览器工具&#xff0c;目的是让 AI 能够像人类一样自然地浏览和操作网页。它支持多标签页管理、视觉识别、内容提取&#xff0c;并能记录和重复执行特定动作。…

Vue--常用组件解析

绑定事件v-on和按键修饰符 v-on:click 表示在button元素上监听click事件 简写&#xff1a;click enter space tab 按键修饰符 keyup是用户松开按键才触发 keydown是在用户按下按键时立即触发 代码展示&#xff1a; <!DOCTYPE html><html lang"en" xml…

《JVM考古现场(十八):造化玉碟·用字节码重写因果律的九种方法》

"鸿蒙初判&#xff01;当前因果链突破十一维屏障——全体码农修士注意&#xff0c;《JVM考古现场&#xff08;十八&#xff09;》即将渡劫飞升&#xff01;" 目录 上卷阴阳交缠 第一章&#xff1a;混沌初开——JVM因果律的量子纠缠 第二章&#xff1a;诛仙剑阵改—…

前端vue 项目px转为rem的自适应解决方案

postcss-pxtorem&#xff08;或是postcss-px2rem&#xff09; npm install postcss-pxtorem amfe-flexible --save-dev 在入口文件 main.js 中引入 amfe-flexible&#xff08;响应式适配&#xff09;&#xff1a; main.js import amfe-flexible // 自动设置 html 的 font-s…

基于时间序列分解与XGBoost的交通通行时间预测方法解析

一、问题背景与数据概览 在城市交通管理系统中,准确预测道路通行时间对于智能交通调度和路径规划具有重要意义。本文基于真实道路传感器数据,构建了一个结合时间序列分解与机器学习模型的预测框架。数据源包含三个核心部分: 道路通行数据(new_gy_contest_traveltime_train…

Day14:关于MySQL的索引——创、查、删

前言&#xff1a;先创建一个练习的数据库和数据 1.创建数据库并创建数据表的基本结构 -- 创建练习数据库 CREATE DATABASE index_practice; USE index_practice;-- 创建基础表&#xff08;包含CREATE TABLE时创建索引&#xff09; CREATE TABLE products (id INT PRIMARY KEY…