AI智能体的分级

技术的分级

人们往往通过对一个复杂的技术进行分级,明确性能、适用范围和价值,方便比较、选择和管理,提高使用效率,促进资源合理分配和技术改进和标准化。

比如,国际汽车工程师学会(SAE)定义了自动驾驶技术的六个等级(0到5级),描述了车辆自动化程度的不同阶段。这些等级详细规定了从完全人工驾驶,经过不同程度的人工辅助驾驶,到完全自动驾驶的过渡过程。

71f6910230f16fb11275afe61fd54359.png

图:国际汽车工程师学会的驾驶自动化分级

象自动驾驶技术这样的分级还使得制造商、监管机构和消费者可以更清晰地理解和衡量技术的能力和限制,更有助于技术普及和市场推广。

29e6f25120f927ee96059de3135fbaab.png

图:通过与驾驶自动化分级对应的驾驶场景,大众能够很好地理解技术和技术对世界和生活带来的影响


智能体的分类

AI的应用飞速发展。那么AI,特别是智能体(AI Agent)技术,是不是也可以分级?Dr. Yu Huang的《Levels of AI Agents: from Rules to Large Language Models》(https://arxiv.org/pdf/2405.06643)一文研讨了这个问题,列举了几种相关的分类方式:

1. 基于AI角色的分级 (Morris分级法)

在《Levels of AGI: Operationalizing Progress on the Path to AGI》 一文中,M R Morris, et. al. 从AI产品设计的视角,以AI类比人类现实生活中的角色,从毫无自主性的“工具(Tool)”角色,到“顾问(Consultant)”、 “合作者(Collaborator)”、“专家(Expert)”, 直至完全自主的"智能体(Agent)",将AI的自主性进行分级。

8bd20bd0659e121268a41522c6a63674.png

图:翻译自论文原文,并有编辑和删减

2. 基于AI承担职责的分级 (Li分级法)

Yuanchun Li, et.al. 则从智能体所承担的职责出发,对智能体进行了分析,发表在《Personal LLM Agents: Insights and Survey about the Capability, Efficiency and Security》一文。

在各级系统中,人类和AI分担不同的职责。级别越高,AI承担更多的职责。

480526817acfca88a1d1cc292237a8ea.png

398c8f6d3f97e53851b9818ecf0747d1.png

图:翻译自论文原文,并有编辑和删减

3. 基于AI功能的分级(Huang分级法)

在他的文章中,Yu Huang也提出了基于AI的功能的分级方法。

1f67419aac8ecf11a0739595844b1e42.png图:翻译自论文原文,并有编辑和删减

可以看到,随着级别的提升,AI具有越来越多的功能。

思考和总结

采用以上对智能体的分级,有助于我们在对特定AI应用进行分析的过程中,为我们解构和剖析提供了一定的方法论。

应用Morris方法论,当前智能体技术应该是在L3的早期,AI主要是人类的copilot,人类和AI的互动有趋向于平等的趋势,但人类仍然在主导几乎所有活动,智能体的自主性还非常有限。

现在的智能体技术(比如MemGPT等工具)已经具备了对情景的感知和记忆的能力,而在Li分类法里,这被认为是非常高阶的能力(L4)。现在的智能体框架软件如AutoGen和CrewAI等已经支持了多智能体之间的协作,这在Huang分类法里是被认为是最高级(L5)智能体才具备的能力。

因此,应用Li分级法和Huang方法,则Agent已经部分到达L4和L5了。

相对于自动驾驶的分级体系,当前的智能体分级方法似乎难以量化回答“当前智能体技术处在哪一级”的问题,标准相对模糊。这是因为“自动驾驶”是一个相对明确的场景,而智能体的应用场景并没有给定的原因。

总体来看,Morris分级法的实用性似乎更强一些。我们期待有更好的分级方法出现。

部分参考资料

  • M R Morris, J Sohl-dickstein, N Fiedel, et al., Levels of AGI: Operationalizing Progress on the Path to AGI, arXiv 2311.02462, 2023

  • Yuanchun Li, et.al. Personal LLM Ai的gents: Insights and Survey about the Capability, Efficiency and Security,05.08.2024

  • Yu Huang, Levels of AI Agents: from Rules to Large Language Models, https://arxiv.org/pdf/2405.06643

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/25514.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

2024年第三届数据统计与分析竞赛(B题)数学建模完整思路+完整代码全解全析

你是否在寻找数学建模比赛的突破点?数学建模进阶思路! 详细请查 作为经验丰富的数学建模团队,我们将为你带来2024年第三届数据统计与分析竞赛(B题)的全面解析。这个解决方案包不仅包括完整的代码实现,还有…

排序题+贪心

排序力扣题 一&#xff1a;合并区间 56. 合并区间 方法一&#xff1a;先排序再合并 如图&#xff0c;把区间按照起点从小到达排序&#xff0c;如果起点相同那么按照终点小的优先排序 然后每次记录一个区间&#xff0c;访问下一个区间&#xff1a; 如果下一个区间的起点<前…

Vue TypeScript 实战:掌握静态类型编程

title: Vue TypeScript 实战&#xff1a;掌握静态类型编程 date: 2024/6/10 updated: 2024/6/10 excerpt: 这篇文章介绍了如何在TypeScript环境下为Vue.js应用搭建项目结构&#xff0c;包括初始化配置、创建Vue组件、实现状态管理利用Vuex、配置路由以及性能优化的方法&#x…

数据中心网络运维探讨

数据中心网络运维探讨 数据中心网络运维通过科学的网络架构设计、实时监控管理、智能化运维工具和全面的安全防护&#xff0c;确保网络的高效、安全运行。它不仅提升了运维效率和网络可靠性&#xff0c;还保障了业务的连续性和数据安全。随着技术的不断进步&#xff0c;智能化…

推测性解码:加速多模态大型语言模型的推理

大模型&#xff08;LLMs&#xff09;以其卓越的性能在多个应用场景中大放异彩。然而&#xff0c;随着应用的深入&#xff0c;这些模型的推理速度问题逐渐凸显。为了解决这一挑战&#xff0c;推测性解码&#xff08;Speculative Decoding, SPD&#xff09;技术应运而生。本文深入…

Vue 2看这篇就够了

Vue 2 技术文档 Vue.js 是一款用于构建用户界面的渐进式框架。与其他重量级框架不同的是&#xff0c;Vue 被设计为可以自底向上逐层应用。Vue 的核心库只关注视图层&#xff0c;不仅易于上手&#xff0c;还便于与第三方库或既有项目整合。而 Vue.js 2&#xff08;以下简称 Vue…

Vue2基础:.sync修饰符的使用,认识,作用,本质案例演示,实现父子之间的通信。

.sync的作用&#xff1a; 可以实现子组件与父组件数据的双向绑定&#xff0c;简化代码。 与v-model的不同点,prop属性名可以自定义&#xff0c;不要一定要用value. .sync的本质&#xff1a; 就是&#xff1a;属性名和update&#xff1a;属性名合写。 下面我们进行代码演示…

探索智慧景区票务系统的架构与应用

随着旅游业的迅速发展&#xff0c;智慧景区票务系统已经成为提升景区管理效率、优化游客体验的重要工具。智慧景区票务系统的架构设计与应用&#xff0c;将现代信息技术与景区管理相结合&#xff0c;为景区的门票销售、入园管理和游客服务提供了全新的解决方案。本文将深入探讨…

【西瓜书】9.聚类

聚类任务是无监督学习的一种用于分类等其他任务的前驱过程&#xff0c;作为数据清洗&#xff0c;基于聚类结果训练分类模型 1.聚类性能度量&#xff08;有效性指标&#xff09; 分类任务的性能度量有错误率、精度、准确率P、召回率R、F1度量(P-R的调和平均)、TPR、FPR、AUC回归…

滑动窗口算法:巧妙玩转数据的窗外世界

✨✨✨学习的道路很枯燥&#xff0c;希望我们能并肩走下来! 文章目录 目录 文章目录 前言 一 滑动窗口是什么&#xff1f; 二 相关题目解析 1. 长度最小的子数组 &#x1f973;题目解析 &#x1f973;算法原理 ✏️思路1 暴力枚举出所有子数组之和 ✏️思路2 滑动窗…

LangChain开发【NL2SQL】应用

前言 关于LangGraph的简单介绍&#xff0c;请参考这篇博客&#xff1a; LangGraph开发Agent智能体应用【基础聊天机器人】-CSDN博客 对比LangChain实现NL2SQL 关于用LangChain开发NL2SQL的Agent应用&#xff0c;在这篇博客提供了完整的代码实现&#xff1a; LangChain开发…

AI网络爬虫:批量爬取豆瓣图书搜索结果

工作任务&#xff1a;爬取豆瓣图书搜索结果页面的全部图书信息 在ChatGPT中输入提示词&#xff1a; 你是一个Python编程专家&#xff0c;要完成一个爬虫Python脚本编写的任务&#xff0c;具体步骤如下&#xff1a; 用 fake-useragent库设置随机的请求头&#xff1b; 设置chr…

NFT 智能合约实战-快速开始(1)NFT发展历史 | NFT合约标准(ERC-721、ERC-1155和ERC-998)介绍

文章目录 NFT 智能合约实战-快速开始(1)NFT发展历史国内NFT市场国内NFT合规性如何获得NFT?如何查询NFT信息?在 OpenSea 上查看我们的 NFT什么是ERC721NFT合约标准ERC-721、ERC-1155和ERC-998 对比ERC721IERC721.sol 接口内容关于合约需要接收 ERC721 资产 onERC721Received…

【教学类-64-02】20240610色块眼力挑战(二)-2-25宫格色差10-100(10倍)(星火讯飞)

背景需求 以下的色块眼里挑战需要人工筛选图片&#xff0c;非常繁琐。 【教学类-64-01】20240607色块眼力挑战&#xff08;一&#xff09;-0-255随机底色-CSDN博客文章浏览阅读446次&#xff0c;点赞12次&#xff0c;收藏5次。【教学类-64-01】20240607色块眼力挑战&#xff…

Linux安装Docker | 使用国内镜像

环境 CentOS7 先确认能够上网 curl www.baidu.com返回该输出说明网络OK 步骤一&#xff1a;安装gcc 和 gcc-c yum -y install gccyum -y install gcc-c步骤二&#xff1a;安装Docker仓库 yum install -y yum-utils接下来配置yum的国内镜像 yum-config-manager --add-re…

tomcat服务器之maxHttpHeaderSize

背景&#xff1a;在OA流程表单中&#xff0c;填写了200条数据&#xff0c;一提交&#xff0c;秒报400错误&#xff0c;且请求没有打到后端中&#xff08;无报错日志&#xff09;&#xff0c;一开始以为是谷歌浏览器的问题&#xff0c;可百度上关于这个错误的解决方案都是清除缓…

转让北京劳务分包地基基础施工资质条件和流程

地基基础资质转让流程是怎样的?对于企业来说&#xff0c;资质证书不仅是实力的证明&#xff0c;更是获得工程承包的前提。而在有了资质证书后&#xff0c;企业才可以安心的准备工程投标&#xff0c;进而在工程竣工后获得收益。而对于从事地基基础工程施工的企业&#xff0c;需…

特种设备起重机指挥题库附答案

1、【多选题】力的三要素是指:( )。(ACD) A、力的大小 B、力的单位 C、力的方向 D、力的作用点 2、【多选题】司索作业规范正确的要求是( )(ABC) A、吊点正确 B、吊索挂设合理 C、绑扎牢靠 D、吊索长短一致 3、【多选题】圆柱形物体兜吊时&#xff0c;一定要放空圈&#…

【python】python GUI编程--tkinter模块初探

✨✨ 欢迎大家来到景天科技苑✨✨ &#x1f388;&#x1f388; 养成好习惯&#xff0c;先赞后看哦~&#x1f388;&#x1f388; &#x1f3c6; 作者简介&#xff1a;景天科技苑 &#x1f3c6;《头衔》&#xff1a;大厂架构师&#xff0c;华为云开发者社区专家博主&#xff0c;…

Keil软件仿真的使用

一、软件的初始化设置 初始设置可以按照下图&#xff0c;这里我使用的是STM32F103C8T6&#xff0c;所以单片机型号为STM32F103C8&#xff0c;这个设置在Debug目录下。然后进行时钟的设置&#xff0c;我们板上晶振为8M&#xff0c;这里将时钟改为8. 或许有人想问如果是别的型号单…