让AI更“智能”的Agent,究竟是什么?

引言

我相信对许多对AI感兴趣的读者来说,“Agent”是个听起来既熟悉又陌生的词汇,而由于ChatGPT引发的浪潮又将Agent的概念推上顶峰,正好借助这个机会我来好好解释一下这个词汇。

Agent的基本含义

在AI领域,Agent基本可以被理解为一个独立的实体,它可以感知环境并作出决策,以达成某种预设的目标,这个决策过程通常建立在某种逻辑或者学习算法之上。在五月份的时候,曾被誉为“硅谷最有权势的华人”的陆奇提出了三位一体理论,描述了一个人获取信息后如何执行的重要节点,而Agent其实可以类比于人类的决策过程——信息-感知-行动。

Agent的工作原理

  1. 感知:Agent能够通过一种或多种方式来获取其所处环境的信息。这些信息获取方式可能包括各种各样的传感器,比如相机、麦克风等输入。
  2. 决策:在获取了环境信息后,Agent会进行决策的过程。这个过程可能会涉及一些复杂的算法,包括但不限于机器学习、强化学习等,即进行思考。
  3. 行动:在做出决策后,Agent将会作出相应的行动,来达到其预设的目标。这个行动可能是实际的物理行动,也可能是虚拟的动作,比如在一个模拟环境中移动。
  4. 学习:许多Agent都具有学习的能力,他们可以根据过去的经验来改进未来的决策。

同样地,我们借助三位一体理论来解释,先来一张图。

在这里插入图片描述

信息到模型

当Agent获取信息后,通过自己的思考形成自己的模型,而通过自己的模型筛选吸收得来的才能叫做知识。

  • 信息是无处不在的,大家都能获取,没有很大的意义;
  • 而知识是独特的,信息是需要自身消化后才能称为知识的,知识是你自己独有的,对自身有重大意义。

模型到行动

Agent通过不断思考就形成了自己的模型,这个模型在现实中其实和“认知”这个词很接近。信息通过模型的筛选后,就将无用信息过滤了,将有用信息留下来并驱动Agent做出决策并做出行动。

行动反哺模型

行动后呢,行动后会对外部世界产生一个影响,这个影响是可以获得的,Agent可以将外界的改变作为自身的反馈来改变自己的模型,实现自身进化。

有没有感觉,整个Agent的工作流程就和人类没有多少区别了,所以通过这种相似的方法构建出的Agent,其决策过程和人类非常相似,那么对人类而言自然就看起来十分“智能”了,这就是一个智能助手了。

Agent的应用案例

  • 游戏AI:在许多视频游戏中,Agent的概念被广泛使用。游戏中的每一个敌人或者非玩家角色(NPC)都可以看作是一个Agent。它们通过游戏提供的信息进行决策,然后作出行动。
  • 自动驾驶:在自动驾驶技术中,整个汽车就可以被看作是一个Agent。它通过各种感应器获取环境信息,然后经过一系列复杂的算法作出决策,并通过驾驶汽车的方式来实现预设的目标。

Agent的概念本质上是对主动性、自主性的一个抽象描述,并在很多实际的应用场景中得到了验证。希望通过这篇文章,你对Agent有了更清晰的理解。如果你对AI有更多的问题或者想法,都欢迎继续提问和交流。

最近一段时间还有很多关于大模型创造或使用工具的Agent,极大增强了大模型的能力,使其能力更强或更专业,如果有兴趣的话可以关注我啊,后续我会进一步分享这部分的内容。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/675846.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

STL之list容器的介绍与模拟实现+适配器

STL之list容器的介绍与模拟实现适配器 1. list的介绍2. list容器的使用2.1 list的定义2.2 list iterator的使用2.3 list capacity2.4 list element access2.5 list modifiers2.6 list的迭代器失效 3. list的模拟实现3.1 架构搭建3.2 迭代器3.2.1 正向迭代器3.2.2反向迭代器适配…

Python常见的免杀方式

10.1节介绍了通过msfvenom生成shellcode ,并通过Python程序加载执行,又 介绍了如何将Python的.py文件生成为exe文件。使用pyinstaller生成的可执行文件 本身就具有一定的免杀能力,但是在与杀毒软件对抗时,部分杀毒软件也可以通 过…

06 MP之自动填充+SQL执行的语句和速度分析

1. 自动填充 在项目中有一些属性,比如常见的创建时间和更新时间可以设置为自动填充。 1.1 实例 需求: 将创建时间和更新时间设置为自动填充, 这样每次插入数据时可以不用理会这两个字段 1.1.1 在数据库增加字段 默认开启驼峰映射 createTime --> create_time…

Spring Boot 笔记 004 自动配置和自定义starter

003讲到了导入jar包中的方法,但其实是个半成品,别人写的jar包中的方法我要在自己的代码中去调用,非常的不方便。原则上写给别人用的jar包,人家要能直接用,而不用写注入的方法。 在springboot中会自动扫描imports文件中…

[Python] 深入理解列表和元组

在学习的C语言中有数组可以用来存储数据,那么在Python中是否也有这样的工具呢?接下来让可莉来给大家讲解列表和元组这两个强力工具吧~ 专栏:《Python》 blog:Keven ’ s blog 在 Python 中,列表和元组是两种常用的序列…

Linux操作系统基础(三):虚拟机与Linux系统安装

文章目录 虚拟机与Linux系统安装 一、系统的安装方式 二、虚拟机概念 三、虚拟机的安装 四、Linux系统安装 1、解压人工智能虚拟机 2、找到解压目录中的node1.vmx 3、启动操作系统 虚拟机与Linux系统安装 一、系统的安装方式 Linux操作系统也有两种安装方式&#xf…

【Linux系统学习】3.Linux用户和权限

Linux用户和权限 1.认知root用户 1.1 root用户(超级管理员) 无论是Windows、MacOS、Linux均采用多用户的管理模式进行权限管理。 在Linux系统中,拥有最大权限的账户名为:root(超级管理员) 而在前期&#…

代码随想录 Leetcode55. 跳跃游戏

题目&#xff1a; 代码(首刷自解 2024年2月9日&#xff09;&#xff1a; class Solution { public:bool canJump(vector<int>& nums) {int noz 0;for (int i nums.size() - 2; i > 0; --i) {if (nums[i] 0) {noz;continue;} else {if (nums[i] > noz) noz …

基于LightGBM的回归任务案例

在本文中&#xff0c;我们将学习先进的机器学习模型之一&#xff1a;Lightgbm。在对XGB模型进行了越来越多的改进以获得更好的性能之后&#xff0c;XGBoost是一种极限梯度提升机器&#xff0c;但通过lightgbm&#xff0c;我们可以在没有太多计算的情况下实现类似或更好的结果&a…

vscode debug无法直接查看eigen变量的问题(解决方法)

主要是给gdb添加一个Eigen相关的printer即可, 网上其他教程都搞太复杂了, 我整理成了一个仓库, 把仓库克隆下来直接运行 ./setup.sh脚本即可配置好 git clone gitgithub.com:fandesfyf/EigenGdb.git cd EigenGdb ./setup.sh 然后在vscode中重新debug即可。 效果 …

使用Arcgis裁剪

提示&#xff1a;文章写完后&#xff0c;目录可以自动生成&#xff0c;如何生成可参考右边的帮助文档 文章目录 前言一、掩膜提取二、随意裁剪三、裁剪 前言 因为从网站下载的是全球气候数据&#xff0c;而我们需要截取成中国部分&#xff0c;需要用到Arcgis的裁剪工具 一、掩…

鸿蒙(HarmonyOS)项目方舟框架(ArkUI)之Slider组件

鸿蒙&#xff08;HarmonyOS&#xff09;项目方舟框架&#xff08;ArkUI&#xff09;之Slider组件 一、操作环境 操作系统: Windows 10 专业版、IDE:DevEco Studio 3.1、SDK:HarmonyOS 3.1 二、Slider组件 滑动条组件&#xff0c;通常用于快速调节设置值&#xff0c;如音量调…

响应式编程详解(持续更新)

响应式编程 1.多维度看全景1.1响应式编程(Reactive Programming )1.2函数式编程&#xff08;Functional Programming, 简称FP&#xff09;1.3技术演进1.4Rx是什么1.5[响应式宣言](https://www.reactivemanifesto.org/zh-CN) 2.钻进去看本质2.1名称解释(rajava)2.2观察者模式2.3…

注解(Java用于工具处理的标注)

一. 使用注解 1. 含义 注解是放在类&#xff0c;方法&#xff0c;字段&#xff0c;参数前的一种特殊“注释”&#xff0c;是一种用作标注的“元数据”。 2. 三类注解 1&#xff09;由编译器使用的注解&#xff0c;不会编译进.class文件&#xff0c;编译后扔掉&#xff1b;如&…

MPLS VPN功能组件(4)

数据转发过程 VPN数据的转发 顶层公网标签 由LDP分配&#xff0c;指示LSR如何将标签报文从始发的源PE通过LSP标签交换到达目的PE 内层私网标签(VPN标签) 由MP-BGP分配&#xff0c;在将每一条客户路由变为VPNv4路由前缀时会自动为每一条VPNv4前缀关联一个标签 内层私网标签用于…

正版软件 - Proxyman:让网络调试变得更智能、更高效

在软件开发的世界里&#xff0c;网络调试一直是开发者和测试工程师的痛点。传统的调试工具往往操作复杂&#xff0c;界面不够直观&#xff0c;而且性能上也难以满足现代应用的需求。今天&#xff0c;我要向大家介绍一款名为Proxyman的网络调试工具&#xff0c;它以其简洁的界面…

springboot微信小程序 uniapp学习资料分享系统v9uy4

理论意义 当今网络教学已成为各国教育改革 和发展的趋势。因此&#xff0c;构建一个适合交互式课堂教学模式的教学平台就成了当务之 急。 在国内高校&#xff0c;目前交互平台主要用于网络学院的远程教学&#xff0c;至于校园内的正规教学&#xff0c;老师自发建立课程主页的比…

【学网攻】 第(24)节 -- 帧中继(点对点)

系列文章目录 目录 系列文章目录 文章目录 前言 一、帧中继是什么&#xff1f; 二、实验 1.引入 实验拓扑图 实验配置 在帧中继中配置通信链路​编辑 实验验证 文章目录 【学网攻】 第(1)节 -- 认识网络【学网攻】 第(2)节 -- 交换机认识及使用【学网攻】 第(3)节 --…

【Linux网络编程三】Udp套接字编程网络应用场景

【Linux网络编程三】Udp套接字编程网络应用场景 应用场景一&#xff1a;远程命令执行应用场景二&#xff1a;与Windos端相互通信应用场景三&#xff1a;简单聊天1.多线程化2.输入输出分开 应用场景一&#xff1a;远程命令执行 简单的服务器上一篇已经完成&#xff0c;接下来我…

【AIGC核心技术剖析】AI生成音乐:MAGNeT一种直接操作多个音频令牌流的掩码生成序列建模方法

MAGNeT是一种直接操作多个音频令牌流的掩码生成序列建模方法。与先前的工作不同&#xff0c;MAGNeT由一个单阶段、非自回归的变压器组成。在训练期间&#xff0c;论文使用掩码调度器预测从掩码令牌中获得的跨度&#xff0c;而在推断期间&#xff0c;论文通过多个解码步骤逐渐构…