AI智能体的分级

技术的分级

人们往往通过对一个复杂的技术进行分级,明确性能、适用范围和价值,方便比较、选择和管理,提高使用效率,促进资源合理分配和技术改进和标准化。

比如,国际汽车工程师学会(SAE)定义了自动驾驶技术的六个等级(0到5级),描述了车辆自动化程度的不同阶段。这些等级详细规定了从完全人工驾驶,经过不同程度的人工辅助驾驶,到完全自动驾驶的过渡过程。

71f6910230f16fb11275afe61fd54359.png

图:国际汽车工程师学会的驾驶自动化分级

象自动驾驶技术这样的分级还使得制造商、监管机构和消费者可以更清晰地理解和衡量技术的能力和限制,更有助于技术普及和市场推广。

29e6f25120f927ee96059de3135fbaab.png

图:通过与驾驶自动化分级对应的驾驶场景,大众能够很好地理解技术和技术对世界和生活带来的影响


智能体的分类

AI的应用飞速发展。那么AI,特别是智能体(AI Agent)技术,是不是也可以分级?Dr. Yu Huang的《Levels of AI Agents: from Rules to Large Language Models》(https://arxiv.org/pdf/2405.06643)一文研讨了这个问题,列举了几种相关的分类方式:

1. 基于AI角色的分级 (Morris分级法)

在《Levels of AGI: Operationalizing Progress on the Path to AGI》 一文中,M R Morris, et. al. 从AI产品设计的视角,以AI类比人类现实生活中的角色,从毫无自主性的“工具(Tool)”角色,到“顾问(Consultant)”、 “合作者(Collaborator)”、“专家(Expert)”, 直至完全自主的"智能体(Agent)",将AI的自主性进行分级。

8bd20bd0659e121268a41522c6a63674.png

图:翻译自论文原文,并有编辑和删减

2. 基于AI承担职责的分级 (Li分级法)

Yuanchun Li, et.al. 则从智能体所承担的职责出发,对智能体进行了分析,发表在《Personal LLM Agents: Insights and Survey about the Capability, Efficiency and Security》一文。

在各级系统中,人类和AI分担不同的职责。级别越高,AI承担更多的职责。

480526817acfca88a1d1cc292237a8ea.png

398c8f6d3f97e53851b9818ecf0747d1.png

图:翻译自论文原文,并有编辑和删减

3. 基于AI功能的分级(Huang分级法)

在他的文章中,Yu Huang也提出了基于AI的功能的分级方法。

1f67419aac8ecf11a0739595844b1e42.png图:翻译自论文原文,并有编辑和删减

可以看到,随着级别的提升,AI具有越来越多的功能。

思考和总结

采用以上对智能体的分级,有助于我们在对特定AI应用进行分析的过程中,为我们解构和剖析提供了一定的方法论。

应用Morris方法论,当前智能体技术应该是在L3的早期,AI主要是人类的copilot,人类和AI的互动有趋向于平等的趋势,但人类仍然在主导几乎所有活动,智能体的自主性还非常有限。

现在的智能体技术(比如MemGPT等工具)已经具备了对情景的感知和记忆的能力,而在Li分类法里,这被认为是非常高阶的能力(L4)。现在的智能体框架软件如AutoGen和CrewAI等已经支持了多智能体之间的协作,这在Huang分类法里是被认为是最高级(L5)智能体才具备的能力。

因此,应用Li分级法和Huang方法,则Agent已经部分到达L4和L5了。

相对于自动驾驶的分级体系,当前的智能体分级方法似乎难以量化回答“当前智能体技术处在哪一级”的问题,标准相对模糊。这是因为“自动驾驶”是一个相对明确的场景,而智能体的应用场景并没有给定的原因。

总体来看,Morris分级法的实用性似乎更强一些。我们期待有更好的分级方法出现。

部分参考资料

  • M R Morris, J Sohl-dickstein, N Fiedel, et al., Levels of AGI: Operationalizing Progress on the Path to AGI, arXiv 2311.02462, 2023

  • Yuanchun Li, et.al. Personal LLM Ai的gents: Insights and Survey about the Capability, Efficiency and Security,05.08.2024

  • Yu Huang, Levels of AI Agents: from Rules to Large Language Models, https://arxiv.org/pdf/2405.06643

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/25514.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

2024年第三届数据统计与分析竞赛(B题)数学建模完整思路+完整代码全解全析

你是否在寻找数学建模比赛的突破点?数学建模进阶思路! 详细请查 作为经验丰富的数学建模团队,我们将为你带来2024年第三届数据统计与分析竞赛(B题)的全面解析。这个解决方案包不仅包括完整的代码实现,还有…

C/C++|关于 namespace 在C++中的代码组织

命名空间(namespace)在C中用于组织代码,避免命名冲突,并提供更好的代码结构和可读性。下面详细解释命名空间在C多文件编写中的各种作用和表达。 基本概念 命名空间是一个声明区域,用于组织代码,防止不同部…

排序题+贪心

排序力扣题 一&#xff1a;合并区间 56. 合并区间 方法一&#xff1a;先排序再合并 如图&#xff0c;把区间按照起点从小到达排序&#xff0c;如果起点相同那么按照终点小的优先排序 然后每次记录一个区间&#xff0c;访问下一个区间&#xff1a; 如果下一个区间的起点<前…

Java基础(7) Object类

目录 一、Object类是什么&#xff1f; 1.定义 2.作用 二、Object类的方法之equals() 1. 2.equals() 3.和equals的区别 三、Object类的方法之toString() 四、Object类的方法之clone() 1.定义 2.基本概念 3.使用clone()方法的步骤 4.举例 五、Object类的方法之final…

自动化测试文档

自动化测试文档的类型 自动化测试方案&#xff1a; 目的&#xff1a;描述自动化测试的目标、范围、方法、资源等。内容&#xff1a;通常包含测试计划、测试用例设计、测试环境配置、测试执行策略、预期结果、风险评估等。自动化测试脚本&#xff1a; 目的&#xff1a;用于执行…

Redis与缓存失效策略:实现高效的数据过期处理

I. 引言 A. 介绍Redis的用途和作用,特别强调其在缓存方面的重要性 Redis是一种开源的,基于内存的数据结构存储系统,支持多种类型的数据结构,如字符串、列表、集合、哈希表、有序集合等。由于其高速的读写性能,Redis被广泛应用为缓存系统,提升应用的响应速度和扩展能力。…

Vue TypeScript 实战:掌握静态类型编程

title: Vue TypeScript 实战&#xff1a;掌握静态类型编程 date: 2024/6/10 updated: 2024/6/10 excerpt: 这篇文章介绍了如何在TypeScript环境下为Vue.js应用搭建项目结构&#xff0c;包括初始化配置、创建Vue组件、实现状态管理利用Vuex、配置路由以及性能优化的方法&#x…

数据中心网络运维探讨

数据中心网络运维探讨 数据中心网络运维通过科学的网络架构设计、实时监控管理、智能化运维工具和全面的安全防护&#xff0c;确保网络的高效、安全运行。它不仅提升了运维效率和网络可靠性&#xff0c;还保障了业务的连续性和数据安全。随着技术的不断进步&#xff0c;智能化…

推测性解码:加速多模态大型语言模型的推理

大模型&#xff08;LLMs&#xff09;以其卓越的性能在多个应用场景中大放异彩。然而&#xff0c;随着应用的深入&#xff0c;这些模型的推理速度问题逐渐凸显。为了解决这一挑战&#xff0c;推测性解码&#xff08;Speculative Decoding, SPD&#xff09;技术应运而生。本文深入…

volatile、extern、static关键字

一、volatile volatile关键字用于告诉编译器&#xff0c;一个变量的值可能在程序执行期间以不可预见的方式发生变化&#xff0c;编译器不应对该变量进行优化。即&#xff1a;编译器不能对这个变量进行优化&#xff0c;必须每次都从内存中读取它的值&#xff0c;而不能缓存到寄存…

Vue 2看这篇就够了

Vue 2 技术文档 Vue.js 是一款用于构建用户界面的渐进式框架。与其他重量级框架不同的是&#xff0c;Vue 被设计为可以自底向上逐层应用。Vue 的核心库只关注视图层&#xff0c;不仅易于上手&#xff0c;还便于与第三方库或既有项目整合。而 Vue.js 2&#xff08;以下简称 Vue…

Vue2基础:.sync修饰符的使用,认识,作用,本质案例演示,实现父子之间的通信。

.sync的作用&#xff1a; 可以实现子组件与父组件数据的双向绑定&#xff0c;简化代码。 与v-model的不同点,prop属性名可以自定义&#xff0c;不要一定要用value. .sync的本质&#xff1a; 就是&#xff1a;属性名和update&#xff1a;属性名合写。 下面我们进行代码演示…

探索智慧景区票务系统的架构与应用

随着旅游业的迅速发展&#xff0c;智慧景区票务系统已经成为提升景区管理效率、优化游客体验的重要工具。智慧景区票务系统的架构设计与应用&#xff0c;将现代信息技术与景区管理相结合&#xff0c;为景区的门票销售、入园管理和游客服务提供了全新的解决方案。本文将深入探讨…

每天一个数据分析题(三百五十六)-图表决策树

图表决策树中将图表分成四类&#xff0c;分别是&#xff1f; A. 比较类 B. 序列类 C. 构成类 D. 描述类 数据分析认证考试介绍&#xff1a;点击进入 题目来源于CDA模拟题库 点击此处获取答案

【西瓜书】9.聚类

聚类任务是无监督学习的一种用于分类等其他任务的前驱过程&#xff0c;作为数据清洗&#xff0c;基于聚类结果训练分类模型 1.聚类性能度量&#xff08;有效性指标&#xff09; 分类任务的性能度量有错误率、精度、准确率P、召回率R、F1度量(P-R的调和平均)、TPR、FPR、AUC回归…

滑动窗口算法:巧妙玩转数据的窗外世界

✨✨✨学习的道路很枯燥&#xff0c;希望我们能并肩走下来! 文章目录 目录 文章目录 前言 一 滑动窗口是什么&#xff1f; 二 相关题目解析 1. 长度最小的子数组 &#x1f973;题目解析 &#x1f973;算法原理 ✏️思路1 暴力枚举出所有子数组之和 ✏️思路2 滑动窗…

docker-compose部署mysql+nginx+redis

docker部署 参考&#xff1a; docker部署mysqlnginxredis docker-compose部署mysqlnginxredis mysql 1、创建docker-compose-mysql.yml version: "3" services:mysql:image: mysql:5.7restart: alwayscontainer_name: mysqlports:- 3306:3306volumes:- /home/my…

LangChain开发【NL2SQL】应用

前言 关于LangGraph的简单介绍&#xff0c;请参考这篇博客&#xff1a; LangGraph开发Agent智能体应用【基础聊天机器人】-CSDN博客 对比LangChain实现NL2SQL 关于用LangChain开发NL2SQL的Agent应用&#xff0c;在这篇博客提供了完整的代码实现&#xff1a; LangChain开发…

AI网络爬虫:批量爬取豆瓣图书搜索结果

工作任务&#xff1a;爬取豆瓣图书搜索结果页面的全部图书信息 在ChatGPT中输入提示词&#xff1a; 你是一个Python编程专家&#xff0c;要完成一个爬虫Python脚本编写的任务&#xff0c;具体步骤如下&#xff1a; 用 fake-useragent库设置随机的请求头&#xff1b; 设置chr…

深拷贝浅拷贝解析,从原理理解深拷贝

这块应该都有过比较深刻的了解了。今天加深下印象和查漏补缺下。 浅拷贝&#xff1a; let original { a: 1, b: { c: 2 } };//这边定一个obj&#xff0c;来供拷贝 let shallowCopy Object.assign({}, original);// let shallowCopy { ...original }; 创建一个浅拷贝对象拷贝…