来源:人机与认知实验室
【博弈智能研究是一个领域,不是一个学科,我们必须要用不同的方法论,从不同的角度来研究游戏,方法论、角度越多,博弈智能研究就会做得越好。】
博弈智能是一种涉及感性(尤其是勇敢)更多的智能,在紧急态势迅速变化时,一个人由情感而非思维支配,因而理智需要唤起勇气素质,继而在行动中支撑和维持必要的理智。
0 引言
随着深度学习、强化学习等新一代人工智能技术的发展,其在计算机视觉、语音识别、自然语言处理、生物医疗领域及游戏博弈等方面取得很大的突破,人工智能在军事领域应用也愈加广泛,催生了军事智能的概念。军事智能与民用智能不同,它有复杂性,因而会衍生出比民用智能更多的花样和不规矩;军事智能与民用智能又相似,它也是智能科学的一部分,都是为用户—这个上帝服务的,只不过,民用智能是让人舒服,而军事智能则是让人不舒服而已。未来的战争很可能是军事智能和民用智能融合,还未开始就已经结束,因为所有的对抗可能性都已经失去了意义。同时各种军用系统是一个人机环境系统,其中涉及到复杂的人机交互及其相互关系的问题,单纯的人工智能与人类智能都不能使其发挥最大效能,人机智能的混合是其重要的发展方向。人所要解决的是“做正确的事”,机所要解决的是“正确地做事”。
准确地说,军事智能不仅包含科学和技术,还涉及许多非科学的领域,如人文社会、哲学艺术、宗教巫术等等,这从世界上最早的兵书——《孙子兵法》的英文名字可见一斑:The art of war,所以军事智能的难度应该就是智能的难度,是当前的民用智能很难企及的:当前的民用智能简单地说就是加了统计概率的自动化系统,缺少非合作博弈强度。未来军事智能的最优存在形态应该不是个体性的(比如异常先进的单平台武器),而是系统性的(网络性的),更有可能是横跨各人机环境系统体系性的(如跨不同网络的陆海空天网体系),并且该体系还会不断自主升级。有人认为通用智能就是人类能做到所有任务的能力,难的是怎么定义那种完全独立于以人类为中心的价值观和偏见的宽度。超级智能需要在主要的概念突破。这些很难预测,即便我们有了速度更快的机器也没啥用。机器目前还不能形成通用化的智能,它们的功能通常局限于某一领域。
如同民用智能没有共识的定义一样,军事智能除了应用领域比较明确之外,现在也没有共同一致的概念,将来可能也很难产生一致认同的概念,因为人本身就是一个极其不容易归纳概括的名词,凡是一涉及到人的行为,尤其是智能行为,更是变化莫测、莫衷一是、阴阳无界、出其不意了。德国军事家克劳塞维茨把战争中多方的智能博弈看作不透明的理论——The theory of war,其实也谈到了军事智能的不确定性和模糊性,甚至是超出了人类认知之外的感叹。
即使世界再复杂,情境再捉摸不定,也总有蛛丝马迹般的端倪会出现。“第三次抵消战略”自2014年9月由美军提出以来,目前已进入全面实施阶段。美国国防部副部长沃克提出,自主学习、机器辅助人员作战、有人—无人作战编组、网络化半自主武器将是“第三次抵消战略”重点发展的五大关键技术领域。美军在2016—2018财年的国防预算中,持续加大对自主系统、情报数据分析、大数据分析、机器人、自动化及先进传感技术的投资强度。是否能研究出支撑技术应用的算法,提升人工智能、自主技术的水平,将成为决定上述各主要方向技术发展的关键所在。从众多公开信息分析不难看出,当前世界排名第一的美军对军事智能领域的重视程度也很高,其主要着力点两部分:一是机器学习,二是自主系统。机器学习就是形式化的(程序规范性的)代表,描述一个规则的事态;自主系统就是意向性(非形式化、事实经验性的)的特点,描述一个可能的事态。形式化推理就是将命题,逻辑联接符号化,然后规定变形规则,进行公式间的转化变形,就可以用来表达推理。非形式化的推理就是不借助符号,而是直接通过自然需要来进行语句间的变换。一开始这两个部分可能是各自为战,分头突进,但过不了多久,该研究的真实意图就会和未来科技的发展趋势越发一致起来:人机融合智能系统。这也说明了军事智能的可见未来既不是单纯的机器学习,也不是可爱的自主系统,而很可能是结合人机各自优势的融合智能,若凝炼成科学问题,本质上就是要回答认知和计算的关系问题。
1 军用智能与态势感知
对军事智能而言,无论机器学习还是自主系统,都不外乎是为了精确地感知、正确地推理和准确地预测,这就涉及到了一个大家司空见惯又望之兴叹的军事智能核心概念之一:态势感知。
军事信息化侧重于形式化的态(道),军事智能化侧重于意向性的势(得),得意忘形,一个是自然的感,一个是自觉的知(上下文)。一般而言,目的是存在与应该的一致,机器没有目的,这是因为机器中的存在与应该都是过去制作者制作的,不是当前使用者面实时临的。人的认知是一种自觉信息处理行为。机的认知不是自觉的。自觉中的校正均衡控制是活性的非预期规划与适应。人机的自然性不同,自由性更不一样。自然有秩序,自由有人文,人是被文所化成的,机是由理所智造的,而理智的自然性和自由性是异于文化的。我们人类并不是直接感知周围物体的颜色的。相反,我们的感知系统会在物体周围环境的基础上进行有根据的“猜测”。
无论军用还是民用,人工智能的本质都不是简单的赋能,而是人类智慧的自我反馈,是他人在不同时空中的概念知识规则概率伦理道德意识在“我”时空情境里的运行,所以常会出现人机融合的不适,不过也很正常:风马牛硬相及的结果。如果非要说,人工智能是赋能,那也是别人以前的可程序化可预测性知识赋予給现在“我”的能力而已。其中的知识一般分为两个层次,顶层由概念的、符号的、离散的或命题性的知识构成;底层的由感觉的、前概念的、亚符号的、连续的或非命题性的知识构成。底层的知识往往涉及到感性,与态势中的“态”有关;而顶层的知识常常涉及到理性,与态势中的“势”有关。
所谓态就是暂时如此的表象,所谓势就是本来如此的真像;态势感知就是通过转换不同的角度思考达到知己知彼的途径,一般是由表及里、由外到内、由左到右、由下到上、由态到势、由感到知,若能够把其逆过程融入进来,即同时还可以由里及表、由内到外、由右到左、由上到下、由势到态、由知到感,那么还可以加入“深度”以示强调,称之为深度态势感知。[16]孙子所说的“知”应该就是这种双向甚至更多向的交互换位融合,就是深度态势感知,而他言的“己”和“彼”也不仅仅是指敌我,还应涉及到各种物和装备,以及对环境的考虑。“自己”这个东西是看不见的,撞上一些别的什么,反弹回来,才会了解“自己”。 所以,跟很强的东西、可怕的东西、水准很高的东西相碰撞,然后才知道“自己”是什么,这才是自我。优秀的指战员不仅可以及时感态、知态,而且还可以迅速地感势、知势。态倾向形式化,势倾向意向性,态势感知就是形式化衍生出的意向性描述,势态感知就是态势感知的逆向过程——资源管理。
态中常常包含专业层级中合乎常规的类型组合,势中往往违背了专业层级中合乎常规的类型组合,美其名曰:常态异势。重要的是,态的表面对称通常会掩盖深层势的不对称,犹如人体显而易见的左右对称掩盖了内部器官的不对称。
态的聚类可以限制态网络中的搜索。态网络中的所有搜索都源于一个核心态(即势)及通过扩散激活从这个势扩展开去。如果围绕一个态进行无限的扩展,最终会得到无数毫无关联的势。未加约束的搜索很快会产生出矛盾且无关的信息。受态聚类约束的搜索(通过态聚类区分其结果的搜索)得到的结果是具有系统性且连贯的。聚类是一种关联,由核心态-势引导的聚类搜索只检索相关的信息。
对“态”而言本质是表征的问题,尤其是静态的表达,侧重于感形(客观存在,being),感己感彼;对“势”而言本质是理解(构建联系)的问题,尤其是动态的会意,侧重于知义(值得、应该,should),知己知彼;由态到态的交互过程,没有智能的出现,得形失意;由态到势的交互过程,亦即数据在流动中生成信息知识(形成价值性)的过程,也就是智能的产生过程,得意忘形。理性很难进行创造,感性很难进行精确。很多态是形不成势的,态形成势的过程就是智能元素成分浮现的过程
态势结构理论在逻辑上把态势刻画为基于结构上的类比匹配的系统,这些结构的构成态来自于不同类型态的聚类或势场。类比匹配出现于态势之间或者描述之间。类比态势具有共同的事实结构;而类比描述具有相同的概念结构。两者区别很大,类比描述不需要为真,只需要共有某些态的规则排列即可。康德可能是第一个区分相似性和类比的人,即类比不表示“两个对象之间的不完全相似性,而是两个并不相似的对象之间关系的完全相似性”,如“人类行动是机械力”。
在军事智能领域中,特别是态势感知处理过程里,态势与感知的形式化、意向性描述分析非常重要,其中形式化就是理性了的意向性,意向性就是感性了的形式化,逻辑就是连接感性与理性、形式化与意向性的桥梁。意向的可及性是其形式化的一个关键,同时,可及性也是可能性向现实性转化的前提条件。就意向性而言,可及性就是(而且几乎总是)态与势之间的限定交互,如同一个事物在不同时空情境(各种态+各样势)中转换的配对和映射、漫射、影射。事实上,从数学的映射到物理的漫射到心理的影射都涉及智能问题,既是逻辑命题与经验命题之间的相互融合过程,也是人类理—解、感—知过程,其中从理到解的一部分变成了人工智能。目前人工智能最难突破的是非家族相似性的漫射、影射问题,人机合作则有利于该问题的解决:人的意向性是形而上,机的形式化是形而下,人机融合就是两者虚实之间的道器结合。差异会产生变化的动力,人是容易感知到前提条件变化差异的,机器对此应对明显不足,如何使机器产生感知外部前提条件的变化,并依此而随机应变。例如,人类的词语、概念、语义不是固定的,是随着情境的变化而自然变化的,而机器的这种畸变就小的多或基本没有,这也是人机融合的一大障碍,变与不变的对立,如何统一就是关键点。需要强调的是:军事智能中的人机合一,不是简单的“人心+机脑”,而是人(单人、多人、敌我)+机(机器装备+机制管理)+作战环境(真实+虚拟)体系的交互统一。
军事智能本质就是主客观的融合,既包括有机融合,也包括无机融合,即是主观以一定方式与客观融合,其目的是适应。军事智能研究第一步是解决表征问题,没有表征,何谈联系,即先搞清楚:(你我它)是“谁”之问题,也就是“知己知彼”。对人而言,之所以诸多表征的不确定性不会造成处理、决策的不确定性,其实是人的意向性和目的性在起作用,人本身就是目的而不仅仅是工具。如中西思维方式的差别:由于西方使用拼音文字,导致字符本身的概念消失,因此必须在强逻辑结构中寻求概念,在抽象中展开知识体系,导致西方人进入逻辑强迫症状态。“态”就是先天已存在的事物发展惯性,“势”就是后天未存在的事物发展惯性,感知就是要理解态、势。深度态势感知就是深度理解态、势。状态注定,但势可改变,但很多人理解成了“态势注定,不可改变”。正可谓态由天定,势由己生。另外,军事智能不是情境/场景/态势性的,而是跨情境/场景/态势性的,因而超越感知的觉。深度态势感知系统不是完美的,但是具有重要的参考辅助价值。是指一种基于复杂性博弈和反思的理解之道。但如果这种理解之道能帮助指战员直面未来战场的各种变故与不确定性,更好地与自己所具有的条件、环境打交道,理解它的复杂性,以及自己在其中扮演的角色,从而拥有一个更有利的过程和结果。也可以理解为,深度态势感知并没有传递给你任何新的知识,而是通过将你原本熟知的事物变得陌生,给予你另一种看待事物的方法,而这个角度可以使你距离胜利更近。
如果说态势感知是形式化的系统,那么深度态势感知就是加了意向性的形式化系统。我们不苛求为深度态势感知提出完美的字面解释,而是希望能给出其中意向性的逻辑释义,毫无疑问,逻辑释义会丢失意向性中某些最令人兴奋的方面:弦外之音、美学意境、拓扑效果。但是我们关心的是真值,我们对意向性的认知意义和形式化的效果感兴趣。语言、逻辑就是把意向性进行形式化的一种工具。艺术与科学的转换也是如此。文化、变化、转化、异化等等中的“化”很有味道,其中不仅仅有融合的意思,也有改变的痕迹,可以笑称为“化”学。同样,状态、动态、变态中的“态”与趋势、形势、局势中的“势”构成的态势图谱也远比知识图谱更可靠、高效、灵巧。究其因,对人而言,事物的属性是变化的,事物之间的关系也是变化的,对机而言,事物的属性是不变的,并且还被人定义了关系变化的区间值域,如知识图谱。而人的势框架,就是把认为需要的部分挑选出来,在决策中进行特别处理,以体现意义解释、归因推论,道德评估,及处理方式的建议。在对任务势框架的形成因素的研究中,势框架应该是有关人员、消息来源、受众、任务情境之间的互动的结果。
对于自主系统而言其实往往就是主动的否定系统(如小孩子成长中最先会说的动词是不(no)、没有、别,这意味着他/她要自主了),而同意常常意味着失去自我(如小孩子若用好的(ok)、同意、太棒了等表达自己观点时,就意味着ta 开始失去自我了)……当然否定自我也只是一种自主,只不过目前机器距此还甚远。如反思产生出的各种隐喻(这是只有人类才具有的特殊能力),隐喻是言外之意,非语法,逻辑是弦内之音,有语法。其实仔细想想,真实的世界不是既有黑也有白吗?所谓的法不就是非少了些吗?规则的形成莫不如此:从小概到大率,然后从合法到非法,隐喻也有法,不过和形式逻辑的法有所不同,隐喻里的法不是语法,是义法、用法,不过时间一长,达成共识,也会变成明喻,变成语法。法就是达成一致了的共识,无法就无天,天就是共识的边界。隐喻不是对态而是对势的指向,是逻辑的逻辑,同时也是大胆假设(想象)下的小心论证(逻辑)。
2 军事智能中的人机混合智能
对于人机混合智能而言,人可以把握实在的可能性,机可以运行逻辑的可能性,两者都会产生因果或相关关系,但这些关系具有不同的意义。即也许存在多重的因果或相关关系于人机融合之中,这些关系有显有隐,交融在一起,进而构造生成了复杂性问题。在复杂系统中可能交织在一起形成多个因果或相关关系嵌套纠缠,而我们注意到的与实际的关系经常存在不一致性。赋予机器智能的假设前提基本上都是有限的,这种有限性限制了众多的变化可能性。这些问题的解决不是靠增添新经验而是靠集合整理我们早已知道的东西——常识。人自身的感和觉也有隐协议,这些默会的协议支配者人的态势感知,是先视后识?还是先识后视?抑或两者在何种态势下混合使用,而且每个人的方式都不同——习惯阅历使然。
人之间的交流也有不少协议,而且这些协议在相互交流中切换自如,游刃有余,不知不觉,变化多端,甚至可以在自相矛盾中自圆其说(如自然语言里的多义性),这些协议中有些是隐性的常识规则,有些是个性化的性格习惯,总体上,两者间的边界模糊,弹性十足,约束宽松,条件灵活……而人机之间的交互协议相比之下,显得是那样的单调、机械、数学,界面分明,有板有眼,一丝不苟,缺乏情趣!
人,尤其是厉害的人,总是能抓住最本质的东西,找到最合适的角度,使得不同现象间的深刻联系浮出水面。机器也正在朝着这个方向被塑造……人会犯错,机器犯的错误也是人错,我们很多经验与对真理的识得也是从错误中得来的。当机器也会真犯错的时候,颠覆就真的开始了。
人既有确定性的一面也有不确定性的一面,机(机器、机制)同样如此,如何把不确定性的一面转为相对稳定的确定性加以使用,这是人机融合的一个重要问题。人的确定性+机的确定性比较好理解,人的不确定性+机的确定性、人的确定性+机的不确定性、人的不确定性+机的不确定性难度会依次递增,解决好这些问题就是人机融合过程。不确定性是由于表征与推理的可变性造成的。其机制背后都隐藏着两个假设:程序可变性和描述可变性。这两者也是造成期望与实际不一致性判断的原因之一。程序可变性表明对前景和行为推导的差异,而描述可变性是对事物的动态非本质表征。人类的学习不但能建立起一种范围不确定的隐性知识,还能建立起一种范围不确定的隐性秩序/规则。机器学习也许可以建立一定范围的隐性知识、秩序,只不过这种范围比人类学习建立的范围要小的多,而且可解释性更差,容易出现理解盲点。高手和菜鸟面对的情境常常是一样的,只不过高手往往会关注关键和临界处,及时地把态进行优化处理成势,而菜鸟却很难进行类似的态势转换,进而造成态的固化不前。
对人而言,机就是延伸自我的一种工具,同时也是认知自我的一种手段,通过机的优点来了解自己的缺点,通过机的缺点来明了自己的优点,然后进行相应的补偿或加强。人机融合还不是一见钟情,这是因为缺乏双向性的感知与觉察。当前更多是主从相声似的人机交互,尽管还并不那么尽人意,捧逗还存在失调失配,但未来仍值得期待:毕竟人在发明机器的同时也在发现着自己。
无维的数据信息衍生出无不为的智能,有维的知识(图谱)衍生出的只是有为的人工智能。孟子说,独乐乐不如众乐乐。幸福越与人共享,它的价值越增加。如果你把快乐告诉一个朋友,你将得到两个快乐。其实,对于军事智能而言,亦是如此,三个臭皮匠相互分享数据信息,智能的融合价值就会越增加。在比较早的时候,惠勒就曾说过“信息即物质(It from Bit)”,信息既是特殊物质也是特殊能量,是虚/暗物质或虚/暗能量,犹如实数与虚数的关系。如果你把知识告诉一个伙伴,你也将在知识的流动中得到更多的知识。就像你在跟同学讲清楚一道难题过程中,常常会得到许多自己独自思考时没有想到的东西一样。数据孤立静止时没有多少价值,一旦流动起来就会形成有价值的信息和知识,流动的数量越大速度越快方向越明确融合越充分,智能化的成分越多,智能程度也就越大,获得胜利的可能性也就越大。
研究清楚人脑解构也解决不了智能问题,没有交互就不会产生关系,没有相互联系就不会有智能出现。另外,机器智能既不能发现万有引力定律和相对论 也不能设计制造飞机和汽车,有何恐惧?人机融合在一起,这一切变得有现实性的可能,这才是真正的可怕!
另一方面,机器是基于大量的正确样本进行训练的,而人类则是基于少量的正确或错误样本进行学习的。另外,机器学习的结果易产生局部最优(也许这也是数学的不足,如蚁群算法),人易把握整体最优。机器学习(形式化)调参很难,人类(使用意向性)相对比较自如。有的人打麻将,打五元一盘的,一天可以赢一千多元,而打五十元一盘的,一天只能赢几百元,有时还输钱。这说明人与机的博弈机制相当不同:。
自主系统本质上解决的是不同时空条件下的设计者、使用者之间的一致性问题。
解决军事智能中人机融合问题首先要打破各种认知惯性,突破传统的时空关系。把感知图谱、知识图谱、态势图谱融合在一起思考。
3 展望
计算的确可以让机器承担很多操作性的任务,但执行操作并不等同于替代执行操作的人。人作为自然实体所进行的操作,与机器通过计算而实现的操作相比,有一个至关重要的区别,就是约翰·塞尔所强调的“意向性”维度。机器的操作不是意向性的活动,因为它不能解释自己的操作;而人的行动则是意向性的,是人所具备的概念能力的体现,在操作的同时也在进行着自我解释的活动。智慧总是关联到决定人们如何理解事实的那些价值目标上。不论是军事智能还是民用智能,都有一个反思内在价值追求的向度,这只能由人的意向性自我解释来实现,而不可能由非人来实现。战争是人与装备的结合,再好的装备也需要人来操作。如俄罗斯在制定人工智能武器方面的立场,突出体现在其关于致命自治武器系统的官方立场文件中,它要求“人在决策循环中”,但不赞同限制国家建立和测试新技术的主权的国际制度的概念。因此俄罗斯国防部门采用以结果为导向,前瞻性的方法来开发人工智能。总的来看,军事智能将会从思想、技术和应用模式上对现代和未来军事作战产生全面影响。目前已在三个方面初见端倪:一是智力会超越体力、信息的有效协同成为决定战争胜负的首要因素;二是无形的(不战)监控取代残酷的(激烈)摧毁成为征服对手的首选途径;三是在体系作战中,人机融合产生出的集智作用有可能超过集中火力和兵力的作用。对人而言,机就是延伸自我的一种工具,同时也是认知自我的一种手段,通过机的优点来了解自己的缺点,通过机的缺点来明了自己的优点,然后进行相应的补偿或加强。人机融合还不是一见钟情,这是因为缺乏双向性的感知与觉察。当前更多是主从相声似的人机交互,尽管还并不那么尽人意,捧逗还存在失调失配,但未来仍值得期待:毕竟人在发明机器的同时也在发现着自己。
一般而言,理性不能用于创造规则,也不能用于设计复杂系统,于是理性只能用于对已经存在的自发秩序的抽象和提炼上。如当我们看到梵·高画笔下的《鞋子》,不是单单观看一个静止的艺术品,而是通过鞋子感受到了人的生活,生活表象后人的思想、情感,从而感受到一个世界。画中的世界、艺术展现出的艺术世界、作者的世界和观者的世界,共同形成了艺术,而最古老的兵书就是战争的艺术(孙子兵法---The art of war)。归根到底,机器所能做的只是计算而已,而在计算与有意义的人类竞争之间,仍然有着根本的区别。正如拿破仑所认识到的,“世界上有两种力量:刀剑和思想。从长远来看,刀剑总是被思想打败”。人是由其信念所构成的,他即他所信。智慧不同于科学知识。科学关心事实如何,但智慧不能只关心事实,还要更关心如何给事物以价值和意义(美国的星球大战计划造成前苏联战略定力不够,进而忽悠崩溃了内部也渐下的前苏联)。军事智能与民用智能最后面临的终极问题很可能不是科技问题,还是那个永恒的话题——道德伦理,这也是超越了智能的智能,道德中的道是道路,德是得到,道德就是通往得到的道路;仁是人,义是应该。仁义道德就是人走向应该获得的道路!这实际上是感知觉的一种深度概念抽象加工,是一种直觉化了的认知框架结构,是一种无意识化了的深度态势感知,即符合内在道德要求的为刺激-反应快模式,而不是理性的刺激-选择-反应慢模式。道德也是最高的军事智能:
不战而屈人之兵
许多博弈要求从事先考察认识能力或划定认识界限的老办法中解放出来,也就是说,打破界限,超越界限。
未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)云脑研究计划,构建互联网(城市)云脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。
如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”