谷歌提出AGI的6大原则,和5大能力等级

随着ChatGPT等大模型的出现,AGI概念正在从哲学层面快速转向实际应用落地,并且ChatGPT已经展示出了初级AGI的功能(如AutoGPT),有不少专家认为,AGI时代可能在10年内到来。

因此,需要一个明确的技术框架来讨论和衡量不同系统的AGI能力。谷歌的DeepMind研究人员提出了6项关于“AGI框架”的定义原则。

基于这些原则,又提出了表现力和通用性两个维度的AGI技术框架,包含5个表现力等级(初级、熟练、专家、大师和超人)和通用详细等级划分。

论文地址:https://arxiv.org/abs/2311.02462

图片

谷歌研究人员表示,这一框架有助于指导AGI定义和风险评估,为技术研究指明了发展方向。期待学术界可以在此基础上开展后续研究,逐步完善AGI的量化框架和基准测试,以更准确地衡量AI的进步,并谨慎应对风险。

AGI简单介绍

AGI英文全称是Artificial General Intelligence,中文译为通用人工智能。AGI是指在任何任务上,AI都可以像人类一样表现出高度适应性和灵活性,高效率地完成指定任务。

当前的AI通常被设计为在特定的任务或问题范围内表现出色,而AGI能够跨领域学习、理解、推理并应用所学知识。

ChatGPT已经具备初级AGI功能,例如,它既能当情感伴侣与你聊天,也能查看邮件、生成创意文本/图片等,帮你处理日常工作。

AGI的主要技术特征包括学习、推理、理解、感知、创造、通用学习、自我意识等重要能力。

学习能力:AGI应能够自主学习新任务,而无需针对每项任务的特殊编程。

推理能力:能够用拟人化的逻辑推理来解决复杂问题。

理解力:可以理解语言、概念、情感等,以及如何处理它们之间的关系。

感知能力:能够通过感官(例如,计算机视觉、语音识别)来感知这个世界。

创造力:能够创造性地解决问题,例如,生成图片、语音、视频等。

通用学习:能够将在一领域学到的知识,迁移到其他领域。

自我意识:理论上,AGI需具备记忆存储、历史查询的能力,让其拥有自我意识以提升工作效率。

图片

谷歌对于AGI则提出了6项更具体,有指导意义的原则,这有助于该技术以健康、安全的方式发展。

通用性和表现力

衡量一个AGI需要同时考量其通用性和表现力两个维度。通用性指能够处理任务的广度和多样性,表现力指在这些任务上达到的水平。

高通用性和表现力都对AGI意义重大且不可或缺。一个系统即使在很多任务上有出色表现,如果这些任务过于相似或局限,也难称为AGI。

反过来,一个极为通用的系统,如果所有任务的完成质量都很差,也与人类智能难以媲美。通用性和表现力必须同时达标,才可能成为AGI。谷歌对于这两个维度给出了详细的定义框架。

1)表现力

初级(Emerging)

要求与不熟练的人类差不多或略胜。对应狭窄AI中的早期专家系统,通用AI中的大型语言模型。

熟练(Competent)

要求超过50%熟练成人的表现。对应狭窄AI中的语音助手、VQA系统等。尚无通用AI达到。

专家(Expert)

要求超过90%熟练成人的表现。对应狭窄AI中的语法检查、图像生成模型等。尚无通用AI达到。

大师(Virtuoso)

要求超过99%熟练成人的表现。对应狭窄AI中的围棋软件AlphaGo等。尚无通用AI达到。

超人(Superhuman)

要求超过100%人类的表现,做到人类根本无法企及的任务。对应狭窄AI中的AlphaFold蛋白结构预测等。

图片

2)通用性

狭窄AI(Narrow AI)

只能处理一小类特定的任务。不同表现力层次要求同上。

通用AI(General AI)

需要能处理广泛的认知任务,包括语言、逻辑、创造等大部分人类有能力的任务。

不同表现力层次对应的最低要求如下:

初级:各任务表现尚可,但大多数任务不佳。

熟练:大多数任务达到一般人中等水平。

专家:大多数任务超过90%人类表现。

大师:所有任务超过99%人类表现。

超人:所有任务超出人类极限。

图片

关注能力而非机制

AGI的定义应该关注AI系统的能力,而不是实现这些能力的具体机制。例如,我们不应该要求AGI必须通过类似人脑的学习机制来实现其能力,也不应将AGI的定义建立在“强AI”这样主观意识方面的假设上。AGI的重点应是评估其可以完成的任务类型和效果。

这条原则的合理性在于,神经网络等当前主流技术的成功正是建立在不完全拟人的基础上。与人脑相比,它们有着完全不同的计算机构成和信息处理方式。

面向能力而非特定机制,既可以避免因为假设了不必要的实现条件而过早地限制AGI的定义,也可以忽略那些目前难以科学检验的主观意识属性,把讨论集中在较为客观和可操作的能力层面。

元认知能力

AGI的定义应该关注处理非物理世界的认知任务,而不是要求必须具备机器人那样的物理能力。元认知能力,如学习新技能的能力,也被认为是AGI达到高通用性的关键。

之所以这样,是因为目前在非物理领域如语言、视觉、推理等方面,AI系统取得的进展明显领先于具备实际移动操作能力的机器人。

将物理能力作为AGI的先决条件,显然过于苛刻。当然,长远来看,在物理世界获得经验可能会提升一些认知能力,但短期内应该关注AI已比较拔尖的认知能力。

关注潜力而非部署

谷歌认为,我们不应该要求一个系统必须被实际大规模部署,才能被认定为AGI。只要一个系统能够在受控环境下,通过标准测试展示完成某类别任务的能力,就可以认定它具备对应的AGI水平。

因为实际部署会带来很多技术之外的障碍,如法律监管、社会接受度等。把部署作为AGI的必要条件,让AGI的判定标准包含了太多非技术因素。我们应该关注AI系统的本质能力,而不是它的实际应用程度。

关于生态

用于衡量AGI的任务应具有生态效度,即与人类在现实生活中重视的任务尽可能接近。不应只关注那些易于量化但是与实际生活脱节的任务。

现有的许多AI基准测试过于简化,脱离实际场景,很难真正评估一个系统在复杂环境下协助人类的能力。

相反,我们需要设计更贴近真实世界,模拟人类活动的测试,以得到对AGI实际能力的准确评估。这需要我们跳出传统的思维定势,不仅追求易测量,也要追求对用户有意义。

关注通往AGI的路径,而非单一目标

谷歌认为,我们应该将AGI视为一个连续发展的过程,而不是一个固定的目标。需要设定AGI发展路径上的多个进展阶段,而不是只关注最终的AGI概念。

这种层次化和渐进的方法有助于我们理解和把控AGI的进展轨迹。不同层次也对应着不同的风险和对策。

如果只一味追求最终的AGI,很容易忽视进展过程中的重要问题。而一个循序渐进的多阶段框架,则支持我们在每一步都审慎地评估机遇和风险,以确保AI的健康发展。

本文素材来源谷歌论文,如有侵权请联系删除

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/143048.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

IP-guard flexpaper远程命令执行漏洞复现 [附POC]

文章目录 IP-guard flexpaper RCE漏洞复现 [附POC]0x01 前言0x02 漏洞描述0x03 影响版本0x04 漏洞环境0x05 漏洞复现1.访问漏洞环境2.构造POC3.复现 0x06 修复建议 IP-guard flexpaper RCE漏洞复现 [附POC] 0x01 前言 免责声明:请勿利用文章内的相关技术从事非法测…

Django框架FAQ

文章目录 问题1:Django数据库恢复问题2:null和blank的区别3.报错 django.db.utils.IntegrityError: (1062, “Duplicate entry ‘‘ for key ‘mobile‘“)4.报错 Refused to display ‘url‘ in a frame because it set ‘X-Frame-Options‘ to deny5.报错 RuntimeError: cryp…

NovelD: A Simple yet Effective Exploration Criterion论文笔记

NovelD:一种简单而有效的探索准则 1、Motivation 针对稀疏奖励环境下的智能体探索问题,许多工作中采用各种内在奖励(Intrinsic Reward)设计来指导困难探索环境中的探索 ,例如: ICM:基于前向动力学模型的好奇心驱动探索RND&…

Linux文件系统

1.基础IO (1)文件操作 在C语言中,用来进行文件操作的函数有很多,比如: 所谓文件操作,简而言之就是通过语言层面向系统层面进行函数调用,命令操作系统为在磁盘上为其创建文件,那么这些…

react Antd3以下实现年份选择器 YearPicker

项目antd版本低,没有直接可使用的年份选择器,参考此篇(使用antd实现年份选择器控件 - 掘金) 一开始在state里设置了time: this.state {isopen: false,time: null } 在类似onChange事件里this.setState({time: valu…

一文搞懂Transformer

近期Transformer系列模型的出现,增加了CV领域的多样性。但是Transformer这一不同领域的模型对学习者来说需要一个细致的学习过程.下面就是本菜鸟总结学习路线。 Transformer是基于attention机制。而attention机制又在Encoder、Decode中。本篇博客将从Attention->…

C# Onnx 轻量实时的M-LSD直线检测

目录 介绍 效果 效果1 效果2 效果3 效果4 模型信息 项目 代码 下载 其他 介绍 github地址:https://github.com/navervision/mlsd M-LSD: Towards Light-weight and Real-time Line Segment Detection Official Tensorflow implementation of "M-…

Hive 查询优化

Hive 查询优化 -- 本地 set mapreduce.framework.namelocal; set hive.exec.mode.local.autotrue; set mapperd.job.trackerlocal; -- yarn set mapreduce.framework.nameyarn; set hive.exec.mode.local.autofalse; set mapperd.job.trackeryarn-- 向量模式 set hive.vectori…

最小二乘法及参数辨识

文章目录 一、最小二乘法1.1 定义1.2 SISO系统运用最小二乘估计进行辨识1.3 几何解释1.4 最小二乘法性质 二、加权最小二乘法三、递推最小二乘法四、增广最小二乘法 一、最小二乘法 1.1 定义 1974年高斯提出的最小二乘法的基本原理是未知量的最可能值是使各项实际观测值和计算…

[数据结构]—带头双向循环链表——超详解

💓作者简介🎉:在校大二迷茫大学生 💖个人主页🎉:小李很执着 💗系列专栏🎉:数据结构 每日分享✨:旅行是为了迷路,迷路是为了遇上美好❣️❣️❣️ …

XoT:一种新的大语言模型的提示技术

这是微软在11月最新发布的一篇论文,题为“Everything of Thoughts: Defying the Law of Penrose Triangle for Thought Generation”,介绍了一种名为XOT的提示技术,它增强了像GPT-3和GPT-4这样的大型语言模型(llm)解决复杂问题的潜力。 当前提…

如何让组织的KPI成为敏捷转型的推手而不是杀手 | IDCF

作者:IDCF学员 伍雪锋 某知名通讯公司首席敏捷教练,DevOps布道者。2020年到2021年小100人团队从0-1初步完成敏捷转型,专注传统制造业的IT转型,研发效能提升。 一、前言 在公司我们常常听见这么一个流传的故事,只要…

HCIA-经典综合实验(二)

经典综合实验(二) 实验拓扑配置步骤配置Eth-Trunk聚合链路第一步 配置二层VLAN第二步 配置MSTP生成树第三步 配置相关IP地址第四步 配置DHCP及DHCP中继第五步 配置三层的网关冗余协议 VRRP及OSPF第六步 配置静态路由,NAT地址转换及其他配置完善 配置验证…

Linux Ubuntu系统中添加磁盘

在学习与训练linux系统的磁盘概念、文件系统等,需要增加磁盘、扩展现有磁盘容量等,对于如何添加新的磁盘,我们在“Linux centos系统中添加磁盘”中对centos7/8版本中如何添加、查看、删除等,作了介绍,而对Ubuntu版本中…

解决k8s通过traefik暴露域名失败并报错:Connection Refused的问题

我敢说本篇文章是网上为数不多的解决traefik暴露域名失败问题的正确文章。 我看了网上太多讲述traefik夸夸其谈的文章了,包含一大堆复制粘贴的水文和还有什么所谓“阿里技术专家”的文章,讲的全都是错的!基本没有一个能说到点子上去&#xf…

解决:element ui表格表头自定义输入框单元格el-input不能输入问题

表格表头如图所示&#xff0c;有 40-45&#xff0c;45-50 数据&#xff0c;且以输入框形式呈现&#xff0c;现想修改其数据或点击右侧加号增加新数据编辑。结果不能输入&#xff0c;部分代码如下 <template v-if"columnData.length > 0"><el-table-colu…

八股文-面向对象的理解

近年来&#xff0c;IT行业的环境相较以往显得有些严峻&#xff0c;因此一直以来&#xff0c;我都怀有一个愿望&#xff0c;希望能够创建一个分享面试经验的网站。由于个人有些懒惰&#xff0c;也较为喜欢玩乐&#xff0c;导致计划迟迟未能实现。然而&#xff0c;随着年底的临近…

智慧城市项目建设介绍

1. 项目建设背景 随着城市化进程的加速&#xff0c;城市发展面临着诸多挑战&#xff0c;如环境污染、城镇综合管理、经济发展布局等。为了应对这些挑战&#xff0c;智慧城市应运而生&#xff0c;成为城市发展的重要方向。智慧城市通过运用信息技术和智能化技术&#xff0c;实…

mmdetection安装与训练

一、什么是mmdetection 商汤科技&#xff08;2018 COCO 目标检测挑战赛冠军&#xff09;和香港中文大学最近开源了一个基于Pytorch实现的深度学习目标检测工具箱mmdetection&#xff0c;支持Faster-RCNN&#xff0c;Mask-RCNN&#xff0c;Fast-RCNN等主流的目标检测框架&#…

Linux 图形界面配置RAID

目录 RAID 1 配置 RAID 5配置 , RAID 配置起来要比 LVM 方便&#xff0c;因为它不像 LVM 那样分了物理卷、卷组和逻辑卷三层&#xff0c;而且每层都需要配置。我们在图形安装界面中配置 RAID 1和 RAID 5&#xff0c;先来看看 RAID 1 的配置方法。 RAID 1 配置 配置 RAID 1…