人工智能与人类智能的竞赛:人机对抗智能技术全梳理

作者: 黄凯奇*, 兴军亮, 张俊格, 倪晚成, 徐博

来源:中国科学院自动化研究所智能系统与工程研究中心

1

引言

人工智能从诞生之始就以对抗人类智能为衡量准则(著名的图灵测试) 。作为人工智能研究的前沿方向,人机对抗技术一直是国内外人工智能研究的热点,以人机对抗为主要形式的人工智能研究为探寻机器智能的内在生长机制和关键技术原理提供了一个极佳的试验环境和验证途径.整个过程不仅能够让机器更加智能地为人类服务、将人类从一些繁复复杂的任务中解脱出来, 而且人类也能够借鉴机器智能的发展过程,提升自身的智能水平,更深刻地理解和掌握智能的内在本质和产生机理,进而推动整个社会由信息化向智能化发展。

2

发展历史

从1936年人工智能之父阿兰⋅图灵提出著名的“图灵测试”之后,人和机器之间进行智能对抗就成为了衡量机器智能发展水平的最重要标准。从实现最初的简单智能到不断进化成更为复杂的智能,对抗贯穿于人工智能中计算、感知认知的3个阶段(图1),从某种意义上讲,就如人类与自然环境的对抗促进了人类的进化,机器与人的对抗也必将让机器智能不断发展进化。

Figure 1 The development history of human-computer gaming

3

内涵及机理

虽然人机对抗智能技术获得极大的关注, 并在不同应用领域展现出应用前景, 但其理论及相关技术目前还没有一个系统性的描述, 本文将从内涵、机理对其进行阐述并在此基础上相关模型及关键技术。

3.1  人机对抗内涵

人机对抗是以机器和人类对抗为途径,以博弈学习等为核心技术来实现机器智能快速学习进化的研究方向。 作为“图灵测试”的重要手段,人机对抗是验证机器智能的“试金石”,为探寻机器智能的内在生长机制和关键技术的验证提供有效试验环境、评价标准,具有重要科学研究意义和应用价值。

3.2  人机对抗机理

人机对抗机理研究对抗各要素及其相互联系,以及相互作用的运行规律与原理,涉及的要素包括人(机器的对手)、机器(对抗的AI)和环境(对抗的规则和条件等的集合体),根据人机物3要素分析方法, 3要素相互作用分别形成一元博弈、二元博弈和三元博弈。人机对抗智能的科学问题可概括为博弈学习的可建模、可计算与可解释。

4

人机对抗模型及关键技术

和感知智能有所不同,人机对抗通常关注更为复杂的时序决策等认知智能,对其过程建模是一个高度复杂问题,因此认知决策建模是整个人机对抗中的核心关键环节。

本文将面向强对抗环境下的人机对抗决策流程归纳为感知、推理、决策和控制,将人机对抗关键技术归纳为对抗空间表示与建模、态势评估与推理、策略生成与优化、行动协同与控制4部分;通过对抗态势判读理解、认知预测、策略决策和行动实施,局部整体不断循环迭代增强, 自主提升对抗能力。人机对抗涉及的关键技术如图2所示。

Figure 2 Process modeling and key technology of human-computer gaming

4.1 对抗空间表示与建模

构建有效的知识表示模型,准确刻画对抗空间的决策要素构成、属性特征及要素之间的交互关系,是实现人机对抗的基础。巨复杂、高动态、强对抗环境具有决策要素海量高维、要素影响高度耦合、决策关键信息不完全等特性,使得对抗空间的定量表示极富挑战。

这方面可开展的研究包括:

(1)对抗空间要素实体–关系表示, 研究对抗空间中各类不同实体、实体属性及其交互关联关系, 构建决策要素的表示模型;

(2)对抗空间特征张量表示学习, 分析实体属性关系耦合和结构拓扑对个体及群体对抗能力的影响, 构建可解释的对抗空间的高维张量描述;

(3)层级化聚合演算规则建模, 融合经验表示与数值计算, 定义多因素、层级化的对抗态势和对抗能力聚合演算规则, 形成环境–我方–对手多元耦合的可计算表征体系; 

(4)基于异构信息网络的抽象通用空间表示, 基于能力演算规则, 研究对抗要素的抽象态势表示, 减轻对抗场景依赖带来的噪声和数据稀疏影响。

4.2 对抗态势评估与推理

对抗态势是指对抗各方通过实力对比、调配和行动等形成的状态和趋势,态势的评估与推理为后续对抗策略生成与优化提供了依据。

面临着的挑战有:

(1)训练态势认知和预测模型的高水平对抗数据往往非常有限;

(2)对手信息往往是凌乱的、不完全的, 仅依据对手部分信息进行整体局势评估准确性较差; 

(3)复杂对抗环境导致可用于态势评估的信息众多,难以有效进行融合以形成多角度层次化态势。

可开展的研究包括: 

(1)高质量对抗数据的生成, 通过自主博弈或者生成式对抗网络等方法生成用于人机对抗建模与分析的高质量人机对抗数据;

(2)小样本学习, 研究在数据较少情况下通过迁移或自适应等方法实现对抗态势的直接评估; 

(3)对方信息估计, 研究结合历史信息与当前对抗环境实现从底层到高层的对手动作估计、意图识别与策略估计; 

(4)态势层次化认知, 研究结合多源异构信息进行态势的多角度层次化评估与推理。

4.3 对抗策略生成与优化

对抗策略主要涉及多智能体协同的任务规划,解决群体与单体的行动规划问题。

其技术挑战在于:

(1)不完全信息使得对手位置、行为、企图不能完全知道,对手行为概率模型未知导致策略选择保守, 需要进行不完全信息下博弈策略选择;

(2)宏观决策收益反馈滞后,使得宏观决策的效应需要经过较长时间才能体现, 导致决策行为与效益之间难以形成有效映射;

(3)行动能力与环境深度耦合,忽略了局部环境因素可能导致策略分析严重偏差,过度详细分析又导致对抗空间难以约减。

针对策略生成和优化方面的挑战,利用策略游戏如星际争霸作为平台开展研究是国际上较为公认的方式。

可开展的研究包括:

(1)宏观策略生成,针对面向使命任务的全局博弈对抗问题,构建分层任务分解与任务协同机制,实现复杂群体博弈对抗问题向低维空间约减; 

(2)微观策略生成, 针对局部博弈对抗问题, 构建微型群体局部策略自适应机制, 实现微型群体的强博弈对抗能力与环境迁移能力;

(3)策略优化方法,针对策略能力需要自主提升的问题,构建博弈策略的评价机制和学习型策略演进机制,实现博弈策略的自主进化与能力提升。

4.4 对抗行动协同与控制

策略的执行需要多个智能体的行动协同,各智能体在自身信息获取与初步认知的基础上,利用资源贡献、信息连通、要素融合、虚拟协作、智能辅助等功能,将多个单元虚拟协同, 形成整合的群体行动协同与控制。多智能体协同的难点包括:多智能体的学习目标,个体回报和团队回报的关系,学习过程中各智能体之间的作用和影响,联合状态和联合动作的获取,扩大的状态空间和动作空间导致的维数灾难等问题。

目前相关研究工作主要集中在多智能体协同与学习方面。可开展的研究包括:

(1)从协同过程可分为序列策略表征、协同机制优化、异构多智能体协同以及多元协同的融合;

(2)从协同任务类型可分为同任务合作智能协同、异任务资源协调等;

(3)从理论上突破去中心化、通信中断的默契型协作方法,任务涵盖序列化任务、多层次任务、多领域任务等,实现场景类型全覆盖,协同方式多元化,为训练提供高质量协同策略。

5

应用及挑战

人机对抗智能技术的应用领域涉及棋牌类游戏、即时策略游戏、兵棋推演等,在多个领域内机器智能已经达到并超过了该领域的人类顶级选手,不断刷新博弈对抗记录,显示出了新一轮人工智能技术在认知决策方面的鲜明特点。

5.1 棋牌类策略游戏对抗

棋牌类策略游戏一直以来都被用作测试计算机智能发展水平的参考标准。这些游戏由于简单的规则和丰富的玩法而深受全球范围内的广大爱好者的喜爱。同样由于其规则的确定性,加之游戏环境可控性和不完全信息等特性,吸引了人工智能领域的持续研究。

DeepMind公司提出的AlphaGo技术在围棋人机对抗中获胜

在1对1无限注德州扑克中,

DeepStack成为了第1个击败职业选手的德州扑克AI程序;

卡内基梅隆大学的研究者提出的名为Libratus的德州扑克AI算法,同样击败了多名顶尖的职业德州扑克选手。

5.2 即时策略游戏对抗

即时策略游戏是另一种常用于评估机器智能的平台,和棋牌类游戏相比,其整个对抗过程即时进行。通常情况下,该类游戏包含资源采集、基地建造、发展科技等若干因素,游戏玩家需要平衡不同因素并控制单个或者多个被控制单元以完成对抗,经典的实时策略游戏包括星际争霸以及Dota2等。得益于国际AI赛事以及企业与学术界的友好合作,即时策略游戏AI取得了长足的进展。

星际争霸AI程序AlphaStar以10:1击败了人类专业选手

相关的AI算法包括基于多智能体强化学习实现被控单元间微操的控制,基于深度神经网络模型进行宏观战斗决策的制定,以及基于状态机模型实现对抗过程的演化等。尽管深度强化学习技术在多个游戏中具有不俗的表现,如何提高模型的稳定性以及性能以击败顶级人类玩家、如何实现模型的可解释以支撑学习的可信任建模仍需要AI算法的不断突破。

5.3 军事模拟及推演对抗

军事模拟及推演由于其战略意义,长期以来受到国家层面的关注,其对抗演练具有重要实用价值.随着博弈对抗规模的扩大,对抗空间呈现指数级增长,多兵种协同与环境耦合的问题凸显,战争系统具有强非线性和高动态等复杂特性,解析计算和随机逼近最佳策略都存在巨大挑战;人机对抗需要发展对手行为意识建模和协同演化博弈策略,以不断提升对抗能力。

空战智能博弈人机对抗系统(ALPHA), 拉开了无人装备对抗有人装备的序幕

自动化所研制的CASIA先知1.0系统在兵棋推演大赛获胜

事实上,博弈贯穿于人类社会的方方面面,博弈和对抗在政治、经济、文化、军事等多方面都发挥着重要的作用, 人机对抗技术也将在信息获取、传输、分析、理解、推理、决策等环节发挥作用,推动感知和认知智能的发展。

6

总结与展望

人工智能尤其是机器学习、类脑计算等领域的发展给人机对抗智能及自主进化带来了契机,迫切需要深化人机对抗问题本质的理解与解析,科学合理地建立机器智能与人类智能的高效协作机制,取得人机对抗理论、技术与应用的重大突破, 并在人类社会的经济、政治、金融 及生活等多领域推进智能化进程。

更多详细信息请见原文!

原文链接

http://engine.scichina.com/publisher/scp/journal/SSI/doi/10.1360/N112019-00048?slug=fulltext 

未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)云脑研究计划,构建互联网(城市)云脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。

  如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/488047.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

工业机器人 答案 韩建海_不可或缺:协作机器人对于制造业转型升级的意义

只要谈到自动化,就很难不提到协作机器人。自从十几年前协作机器人问世以来,它们便承担起了众多企业的自动化任务。新冠之前,英国制造业正在应对英国退欧和劳工短缺的不确定性。但是,他们无法预见新冠对行业的影响。任何行业都无法…

Python爬虫用Selenium抓取js生成的文件(一)

简介任务简述实现过程 简介 我最近在看关于计算机的一些书籍,发现了这个电子书清单:计算机开放电子书汇总, 和大家分享一下. 我在下载其中的书籍时被导向了这个很好的计算机电子书网站KanCloud看云,里面有非常多的实用的编程方面的电子书,很多是该网站自己用html生成的,格式多…

golang 升级到新版本_Scikit-learn新版本发布,一行代码秒升级

十三 发自 凹非寺 量子位 报道 | 公众号 QbitAIScikit-learn,这个强大的Python包,一直深受机器学习玩家青睐。而近日,scikit-learn 官方发布了 0.22 最终版本。此次的更新修复了许多旧版本的bug,同时发布了一些新功能。安装最新版…

重磅:2020年度获国家科学技术奖励提名的材料项目汇总

来源:http://www.nosta.gov.cn/upload/2020slxmgb/showProject.html转自:材料人2020年3月24日,科学技术部发布了《国家科学技术奖励工作办公室公告第95号》文件。这份文件对2020年国家自然科学奖、国家技术发明奖通用项目、国家科学技术进步奖…

完全理解Android中的RemoteViews

一、什么是RemoteViewsRemoteViews翻译过来就是远程视图.顾名思义,RemoteViews不是当前进程的View,是属于SystemServer进程.应用程序与RemoteViews之间依赖Binder实现了进程间通信.二、RemoteViews的用法RemoteViews使用最多的场合是通知栏和桌面小插件. 以通知栏为例,讲解下它…

各大媒体优劣对比_吉利星瑞特别版对比朗逸,亮点只有性价比?

据悉,吉利汽车推出了星瑞特别版车型——星瑞设计师推荐款,新车已于10月11日的11:00开启抢购,限量3000辆,抢购价格为13.77万元。其中值得注意的是,新车的抢购流程有所不同,想参与抢购的消费者需要先完成吉利…

【推广】实用命令——tldr

碎碎念如题,通常遇到一个新的命令需要查询其帮助的时候,一般使用command -h或者man command来查询,但是,有时候仅仅想知道这个命令怎么用,并不想知道具体含义啊(这个命令可能不常用,没有必要仔细阅读手册)&…

Nature重大突破!将皮肤细胞直接转化成感光细胞让小鼠重见光明!

图片来源:https://cn.bing.com本文系生物谷原创编译,欢迎分享,转载须授权!研究人员发现了一种直接将皮肤细胞重新编程成用于视觉的光敏杆状感光器的技术。实验室制造的杆状体使失明的老鼠能够在细胞移植到眼睛后探测到光线。这项研…

时间组件选择一个时间段_衡南(光伏支架组件安装)施工队

衡南(光伏支架组件安装)施工队光伏支架安装本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,安…

DNA存储,拯救人类数据危机的良方?

来源:脑极体开一个脑洞:如果地球正在面临一场马上到来的毁灭性星际灾害,人类又想尽可能地保存地球的生命和文明,在现有条件下,该怎么办?像大刘一样让地球停止自转然后逃离太阳系,这恐怕来不及了…

oracle数据库dblink创建语句_「运维实验」——达梦数据库DBlink连接Oracle配置

经过昨天达梦数据库间DBlink配置(具体操作可回看上一篇文章),今天做延伸实验。实验环境说明Oracle数据库1:192.168.80.40 ora11g RHEL 6.5 64位达梦数据库1:192.168.80.41 DMSERVER2 RHEL 6.5 64位oracle数据库版本&am…

智能经济的动力,从人工智能到超级智能

作者:刘锋前言:本文是根据研讨会发言形成的探讨性文章,主要阐述了智能经济的产生本质上是科技生态发生重大变化后的产物。提出智能经济运转的动力除了人工智能,人类的智能,互联网大脑模型的超级智能也是新出现的要素。…

损失函数_SRGAN损失函数(目标函数)详解

概要SRGAN的特点之一就是引进了损失感知函数,由此提升了超分辨率之后的细节信息。本文主要像您介绍SRGAN使用的损失函数,及其Keras实现。损失函数公式这是原文中给出的损失函数。容易看出,此损失函数包括两部分,第一部分是感知损失…

PHP获取本月起始和终止时间戳

一、本月起始和结束 //获取本月开始的时间戳 $beginThismonthmktime(0,0,0,date(m),1,date(Y)); //获取本月结束的时间戳 $endThismonthmktime(23,59,59,date(m),date(t),date(Y)); View Code二、上月起始和结束 写法一: $m date(Y-m-d, mktime(0,0,0,date(m)-1,1,…

人工智能细分领域龙头企业排行榜单

来源:互联网周刊2020年3月4日,中共中央政治局常务委员会召开会议,提出要发力于科技端的基础设施建设,人工智能成为“新基建”七大版块中的重要一项。“新基建”不同于传统思路,其本质是信息数字化的基础设施建设&#…

基于原版Hadoop的YDB部署(转)

YDB依赖环境准备 一、硬件环境 硬件如何搭配,能做到比较高的性价比,不存在短板。合理的硬件搭配,对系统的稳定性也很关键。 1.CPU不是核数越高越好,性价比才是关键。 经常遇到很多的企业级客户,他们机器配置非常高&…

物联网基石,五大领域对智能传感器的需求暴涨

来源:仪商网 传感器好比人的眼耳口鼻,但又不仅仅只是人的感官那么简单,它甚至能够采集到更多的有用信息。既然如此,就可说这些传感器是整个物联网系统工作的基础,正是因为有了传感器,物联网系统才有内容传递…

c6011取消对null指针的引用_C/C++学习笔记——C提高:指针强化

指针是一种数据类型指针变量指针是一种数据类型,占用内存空间,用来保存内存地址。void test01(){ int* p1 0x1234; int*** p2 0x1111; printf("p1 size:%d\n",sizeof(p1)); printf("p2 size:%d\n",sizeof(p2)); //指针是变…

现在的人工智能只是“窄AI”?

来源丨The Next Web编辑丨科技行者1956年,由数学系年轻的助理教授John McCarthy领导的科学家小组齐聚新罕布什尔州的达特茅斯学院,计划进行一个为期六周且雄心勃勃的项目:创建一种能够“使用语言、形式抽象与概念,帮助人类解决各类…

需要单机还是集群部署_单机、集群和分布式(微服务结构)的区别

一、单机单机就是所有的业务全部写在一个项目中,部署服务到一台服务器上,所有的请求业务都由这台服务器处理。显然,当业务增长到一定程度的时候,服务器的硬件会无法满足业务需求。自然而然地想到一个程序不行就部署多个喽&#xf…