来源:人机与认知实验室
【数据、信息、知识、智能除了转换外,是否还有变异、弥聚等?能否把这些变化看成是态、势、感、知结构扭曲而产生的必然现象?】
摘要 如何把信息转换为解决问题所需要的智能,是信息科学领域的核心研究课题. 本文报 道的“信息转换原理”提供了一种把信息转换成为智能的可行方法.为了能够把信息转换为智能, 它首先突破了信息论局限于统计形式的限制, 建立了全信息理论; 然后,研究了作为信息与智能中介的知识理论, 发现知识的生态规律“信息-知识-智能转换”就是智能的生成机制,因而提出了智能生成机制的模拟方法, 使人工智能三大主流方法(结构模拟、功能模拟、行为模拟)实现了统一;在此基础上定义了意识-情感-理智三位一体的高等人工智能模型,证明了意识、情感和智能都可以由各自条件下的信息转换生成出来,从而建立了基于信息转换的高等人工智能理论, 成为沟通信息理论、知识理论和智能理论的一体化理论.
关键词 信息论 全信息理论 知识生态 机制模拟 信息转换 高等人工智能
信息、知识、智能,是现代科学3个具有基础性和关联性的当代重要研究领域,如何把信息转换成为解决问题所需要的智能,是信息与智能科学领域的核心研究课题, 也是整个现代科学技术十分关注的问题. 当今世界各国经济和社会发展的信息化、知识化和智能化进程,对信息理论、知识理论、智能理论、特别是信息-知识-智能的一体化理论研究提出了 十分迫切的需求.
然而, 关于信息、知识、智能3个领域的理论研究却发展得不太平衡, 而且基本上处于互相独立发展的状态.
在信息理论研究方面,1948年由Shannon所创立的信息理论(原来称为《通信的数学理论》)实际上是一种建立在概率论和随机过程理论基础上的统计通 信理论, 它所关心的问题是在噪声环境下如何有效、可靠、安全地把信号从一个地点传送到另一个地点. 同年Wiener出版的《控制论》研究了动物与机器中的控制与通信问题, 其中的信息理论实际上与 Shannon的信息理论异曲同工.
在知识理论研究方面,虽然在20世纪70年代出现了以知识推理为特征的“知识工程”研究, 20世纪90年代兴起了面向特定数据库的“知识发现”研究. 但是, 这两方面的研究都还处在发展的初级阶段,而且,它们之间几乎没有建立任何互相关联. 因此, 至今没有形成系统性的知识理论.
在人工智能理论的研究方面,主要关注的问题则是如何在计算机平台上编制“聪明软件”来解决诸如定理证明、问题求解、机器博弈和信息检索等复杂问题.而且,这一方向的研究一直与人工神经网络的研究和感知-动作系统以及多智能体的研究缺乏必要的沟通, 在智能领域呈现出鼎足三分的状态. 不仅如此, 在人工神经网络研究与人工智能研究之间以及感知-动作研究与人工智能研究之间 还存在严重的分歧. 事实上, 学术界也作了很大的努力, 试图消除人工智能、人工神经网络和感知动作系统3种研究方法之间的歧见,达成研究方法的统一。但是,并未取得实质性的成功.
显然, 信息理论、知识理论、人工智能理论之间这种相互脱节的研究状况, 不利于信息科学技术、知识科学技术和人工智能科学技术的发展,更不利于信息理论、知识理论、智能理论的一体化研究,不能适应现代科学技术和经济社会发展的需要.
有鉴于此, 信息理论、知识理论、智能理论及其一体化理论的研究具有十分重要的意义, 值得人们高度关注. 本文以下将介绍信息、知识、智能一体化 理论的基本结果“信息转换原理”, 包括这一原理的 主要支撑理论: 全信息理论、知识生态学规律、智能的生成机制、人工智能的机制模拟方法、人工智能的统一理论以及高等人工智能理论. 由于篇幅的缘故, 这里将主要介绍取得这些结果的研究思路和科学方法. 详细的情况参见相应文献.
1 全信息的理论
1948 年, Shannon在《贝尔系统技术学报》发表了题为“通信的数学理论”的长篇论文, 针对通信系统的需求提出了信息的概念和度量方法, 定义了信道容量公式, 建立了反映信息传输基本规律的三大编码定理, 成为信息论的奠基之作.
至今, Shannon信息论仍然在通信领域发挥着重要的指导作用. 而且, Shannon 的信息论和Wiener的控制论以及 Bertalanffy 的系统论一起(史称“三论”)成为现代科学研究方法论的三大支柱.
20 世纪 70 年代末, 本文作者曾经这样设问: 既然Shannon理论是关于通信的数学理论,为什么后来要改称为信息论?既然改称为信息论,是否就意味着Shannon理论不仅适用于通信领域,而且也适用于信息过程的其他领域(包括传感、计算、人工智能和 控制)?
结果发现, Shannon信息理论的应用有着很强的限制条件. 一方面, 它的主要数学基础是概率论, 不满足概率公理条件的场合原则上不能应用; 可是, 信息过程的许多领域并不满足概率公理的条件.另一方面,针对通信工程的特殊需要,Shannon信息理论只考虑了信息的形式因素(信号波形),有意地忽略了信息的内容和价值因素(见文献[1]的第一部分); 可是, 在信息过程的许多领域(特别是智能决策领域)却需要同时考虑信息的形式、内容、价值因素. 由此可以判断, Shannon 信息论主要适用于通信这类能够满足统计条件的领域,而不能适用于信息的整个过程, 特别不能适用于信息过程的核心领域——智能决策领域.
有了这样的认识, 我们便决心研究“同时考虑信息的形式、内容和价值因素而且既能适用于统计条件又能适用于非统计条件的信息理论”.并把这样的信息理论命名为完全的信息理论, 简称为“全信息理论”; 以这一理论为基础, 系统研究和总结了全信息在整个信息过程(包括传感、通信、计算、智能、控制)的工作原理, 在1988年出版了题为《信息科学原理》的学术专著. 这是国内外第一部系统阐明信息科学基本原理的学术著作, 于1996, 2002, 2005年3次再版.
“全信息理论”和《信息科学原理》所以取得成功,主要得益于两个重要条件:
首先, 在方法论上得益于自觉应用了“信息观和系统观”:坚持“全信息理论”的信息概念必须是一个 完整的体系, 即它的内涵应当包含信息的形式、内容 和价值(而不仅仅是信号波形); 全信息理论的适用范围必须是全部信息过程, 而不仅仅是通信过程. 这样就在方法论上奠定了超越Shannon信息论的创新基础.
其次,在数学方法上得益于同时应用了概率论和模糊集合理论,正是借助了模糊集合理论的数学工具才建立了信息内容和价值因素的描述和测度, 并使全信息理论能够适用于概率和非概率场合. 这样就在数学方法上具备了超越 Shannon 信息论的 条件.
应当指出,方法学上的“信息观和系统观”与数学上的模糊集合理论这两者都是 Shannon那个时代还不曾出现的, 是1948年至今这段历史时期才出现的科学新成果. 因此, 全信息理论和信息科学原理是时代进步的产物.
有了全信息理论, 原来各自独立研究的传感、通信、计算、智能、控制学科就可以相应地被定义为信 息的获取、信息的传递、信息的处理、信息的转换、 信息的执行, 因而都可以建筑在全信息理论这个统一的理论基础上,形成统一的信息科学理论.这样,Shannon信息论就成为“全信息理论”的一个“统计通信理论”分支.
理论上的统一性和完整性, 对于信息科学理论的发展来说具有十分重要的意义.
2 知识的生态学规律
在完成了《信息科学原理》的出版工作之后, 研究的注意力便聚焦到了信息过程的核心领域——智能理论的研究.
我们首先自我设问: 智能是怎样生成的? 我们认为:作为发现问题、分析问题和解决问题能力的智能, 必然来源于与问题和问题求解目标相关的“知识”: 若是没有知识, 何以有智能? 于是, 知识的理论成为智能理论研究的先导和关键.
自古(特别是近代工业革命)以来,科学技术的进步和社会经济的发展创造了极其丰富的文化科学知识. 可是, 人们对于知识的发展规律却鲜有顾及. 哲学家们悉心探讨和论述了知识的理论, 特别探讨 了知识的概念和性质, 但对知识的生长规律却少有论述.
虽然Feigenbaum等人在20世纪70年代提出了“知识工程”的课题,20世纪90年代学术界也兴起了“知识发现”的研究.但是,“知识工程”只关心了如何由知识推演策略的问题; “知识发现”只关心从特定数据库的数据中发现知识的方法. 两者都没有对知识的生长规律展开专门的探究.于是,经过深入的研究,我们在2000年的《中国工程科学杂志》上发表了题为“知识理论框架”的论文,探讨了知识的定义、分类、描述和度量的方法, 特别总结和阐述了“知识的生态学规律”.
论文指出: 知识既非自古就有也非万古不变的东西; 相反, 知识是一个活生生的生态学系统, 遵循着固有的生态学规律: 在内部, 它是在本能知识的支持下首先由信息生长出“欠成熟”的经验知识, 进而生长出“成熟”的规范知识, 最后生长(沉淀)出“过成熟”的常识知识, 后者又通过某种机制生长成为本能知识的新内容, 使本能知识逐渐增长; 在外部, 它不断由信息生长出来, 又不断向智能策略生长而去. 论 文把前者命名为“知识的内部生态学规律”,把后者命名为“知识的外部生态学规律”, 两者的整体称为 “知识的生态学规律”.
因为知识的外部生态规律就是智能的生成机制,阐明知识的生态学规律不仅对认识知识本身的发展规律具有重要指导意义; 而且对认识智能的生长规律具有决定性的贡献.
3 智能的机制模拟方法
由于智能研究所具有的基础性和复杂性,人们沿用了“分而治之”的传统方法论把模拟人类智能的研究分解为结构模拟、功能模拟、行为模拟三大主流研究方法, 并分别形成了基于结构模拟的人工神经网络研究、基于功能模拟的物理符号系统研究、基于行为模拟的感知与动作系统研究.3种研究方法各自都获得了不少令人鼓舞的成果. 但是由于对人类智 能系统在结构、功能、行为之间相互联系和相互作用的机制缺乏深刻的认识,3种研究方法之间一直未能互相沟通形成合力, 却常发生“孰优孰劣”的激烈争论, 造成了互不认可各自为战的研究格局, 在一定程 度上延缓了人工智能研究的发展.
许多有识之士都希望打破这种各自为战的格局.人工智能领域资深权威学者Nilsson于1998年出版了题为“Artificial Intelligence: A New Synthesis”的学术 专著, 试图用“新的集成”来集成3大研究方法; 人工智能的后起之秀Russell等人则于1995年出版了1000多页的宏篇巨著“Artificial Intelligence: A Modern Approach”, 试图以“现代途径”来沟通三大研究方法.据悉,这部著作于2003和2006年连续再版, 先后被 89个国家 900 多所大学用作教材, 可见影响之广泛, 也可见人们期望三大方法走向沟通统一的愿望多么强烈.
但是,仔细阅读这些新著可以发现,它们除了把三大主流研究方法的成果直接拼合在一起之外, 并没有找到三大方法之间的内在本质联系. 因此, 沟通 三大主流方法形成人工智能统一理论的目标基本没有实现.
人工智能是一类开放的复杂信息系统, 传统的“分而治之”方法论在把复杂信息系统分解为若干子系统的时候, 往往丢失了这些子系统之间相互联系相互作用的信息; 而这些信息正是复杂信息系统的灵魂和生命线. 同样, 把智能模拟分解为结构模拟、功能模拟、行为模拟的时候, 也丢失了结构模拟、功能模拟、行为模拟之间互相联系和互相作用的信息. 这是三大主流方法之间无法实现沟通的方法论原因.
为了克服传统方法论带来的上述问题, 我们认为: 既然人工智能是一类开放的复杂信息系统,就必须坚持“信息观、系统观、机制观”的科学观念和“信息转换”的方法论.于是提出了新的智能模拟方法——机制模拟.因为,只有“智能的生成机制”才是统领智能系统全局的决定因素, 只有“智能的生成机制”才可以全面揭示智能的奥秘, 而系统的结构和功能都是为实现智能生成机制服务的, 系统行为则是实现智能生成机制的必然结果.
如上所说,“知识的外部生态学规律”指出: 知识由信息生长而来, 又向智能策略生长而去. 这就明确无误地昭示人们: 智能的生成机制就是“信息-知识智能策略的转换”. 这对于智能理论的研究来说, 无 疑是“一语中的”.
为了简明, 可以把“信息-知识-智能策略转换”简 写成为“信息转换”. 后面很快就可以看到, 信息不仅可以转换成为知识和智能策略, 而且可以转换为注意能力、基础意识能力、情感表达能力、理智谋略能力和综合决策能力. 当然, 这里的信息必须是全信息.
于是, 基于“信息转换”的人工智能机制模拟方法是独立于结构模拟、功能模拟和行为模拟这三大主流方法之外的第4种智能模拟方法. 而且, 从方法论的意义上可以判断:它是比三大主流方法更加深刻更加科学的智能模拟方法. 这是人工智能研究 的突破.
4 人工智能研究方法的统一
如上所说, 人工智能的机制模拟方法的实现途径, 就是“信息-知识-智能策略转换”. 按照“知识的内部生态学理论”把其中的“知识”具体展开, 就可以得到机制模拟方法在不同知识(本能知识、经验知识、规范知识、常识知识)条件下的4个具体型式: A, B, C 和 D 型, 如表1前4列所示.
不仅如此, 表 1 还进一步表明, 现有人工智能三大主流方法——基于结构模拟的人工神经网络研究、基于功能模拟的物理符号系统研究、基于行为模拟的感知-动作系统研究——分别是机制模拟方法在各自相应知识条件下的特例.
根据“知识的内部生态学规律”,经验知识、规范知识、常识知识和本能知识互相之间是“相生”的关系,而不是“相克”的关系.这就表明,人工智能的结构模拟方法、功能模拟方法、行为模拟方法之间也应当是 “相生”的关系, 而不是“相克”的关系. 换言之, 原来一直“互不认可”的三大主流方法, 却在机制模拟方 法的框架内实现了和谐的统一.
这是一个发人深省的启示: 如果运用的方法论不恰当, 事物之间的本质联系就会被掩盖; 而一旦运用了正确的方法论, 事物之间的内在本质联系就会豁然显现. 人工智能原有三大主流方法之所以“互不认可”, 不能形成合力, 根源就是“分而治之”方法论 在人工智能这类开放复杂信息系统的研究中失灵. 而人工智能机制模拟方法之所以能够实现三大主流方法的和谐统一,根源也在于“信息观、系统观、机制观”的科学观和“信息转换”方法论适应了人工智能 这类开放复杂信息系统研究的需要. 由此, 可见科学 研究方法论的重要性.
5 高等人工智能理论
基于信息转换的人工智能机制模拟方法和谐地统一了原来长期各自独立发展的三大主流研究方法, 形成了统一的方法和理论, 消除了内耗, 形成了合力. 这是自1943年以来人工智能理论研究历史上一个意义重大的进步.
但是, 当进一步思考人工智能理论研究的时候, 我们又发现了更大的问题: 一方面, 长期以来, 人工智能的研究回避了人工意识的研究; 另一方面, 人工智能研究也在相当长时期内忽视了人工情感的研究. 然而, 没有意识能力的系统不可能拥有智能. 这就是说, 没有意识的智能是不真实的. 同样众所周知的是, 没有情感的系统不可能拥有完全的智能, 换句话说, 没有情感的智能是不完全的. 因此, 虽然人工智能原 有的三大主流研究方法在机制模拟方法的基础上得 到了和谐的统一, 但是, 人工智能本身的概念、模型、方法、理论是不能令人满意的, 是人工智能理论研究的重大缺陷.
于是, 经过深入研究我们提出了“以基础意识、情感、理智3位一体为特征的高等人工智能理念”和相应的高等人工智能系统功能模型, 后者如图 1 所示.
在图1的模型中, 现行人工智能意义上的“智能” 被赋予了新的名称——理智, 这是为了与情感相默契 (情感也是一种智能, 可以称为情智); 一般意义上的 意识被限制为可以明确界定和便于实际检验的“基础 意识”(接近于临床医学意义上的意识概念), 这是因 为一般意义上的意识概念太笼统, 又太复杂, 不便研 究. 此外, 模型中还表现了“注意”的功能, 这是任何 真实的智能系统所不可缺少的. 还有, 情感生成和理 智生成被安排成了两个不同的支路, 这是脑神经科 学和认知科学已经证明了的结构. 正因为如此, 模型 中需要安排“综合决策”的模块, 它负责对情感和理 智进行协调和综合. 最后, 记忆系统也是在“全信息” 意义上工作的, 这是很重要的特色. 此外, 图中记忆 系统提供的 a 代表本能知识和常识知识; b 代表本能 知识、常识知识和经验知识; c 代表本能知识、常识 知识、经验知识和规范知识; d 代表本能知识、常识 知识、经验知识、规范知识和艺术知识等. 把知识做 这样的划分只是为了使功能分析上更加清晰,实际的情况可能会更复杂.
详细解释这个模型需要太多的篇幅, 有兴趣的 读者可以参看作者在科学出版社出版的学术专著《高等人工智能原理: 观念-方法-模型-理论》.
研究发现,高等人工智能的所有要素——注意能力、基础意识能力、情感能力、理智能力和综合决策能力的生成机制, 分别是在外来刺激所呈现的信息 (称为“本体论信息”)的激励下启动、在各自的知识支持下展开、在各自目标的导控下完成的信息转换: 包括第一类信息转换(由本体论信息到全信息的转换) 和第二类信息转换(包括由全信息到注意能力的转换、全信息到基础意识能力的转换、全信息到情感能力的转换、全信息到理智能力的转换以及到综合决策能力的转换), 这样, 就完成了高等人工智能原理的基本建构. 这些信息转换的情形, 如表 2 所示.
解释表2所示的各项结果需要较大的篇幅, 有兴趣的读者可以参阅文献[34].
特别值得指出的是,无论是通过机制模拟方法实现人工智能3大主流方法的统一, 还是通过机制模拟方法实现高等人工智能理论体系的建立, 其间最为重要的科学基础是由“信息观、系统观、机制观” 启迪的“信息转换”原理. 正是通过信息转换原理, 才揭示了长期互相脱节的信息理论、知识理论、智能 理论之间内在的本质联系, 形成了信息、知识、智能 的一体化理论. 同样, 也正是通过信息转换原理的应 用, 才可以把粗糙的信息资源(这是与物质、能量同 样重要的战略资源)转换成为人类所需要的各种高级 智能产品. 因此, 信息转换原理的科学意义, 当可与质量转换和能量转换定律相媲美.
6 结语
人类生存与发展的基础条件是资源; 科学技术的任务就是把资源转换为人类生存发展所需要的能力产品. 信息是当代3大战略资源之一, 因此, 把信息资源转换成为人类需要的各种智能能力产品, 是信息科学技术面临的历史使命.
本文所介绍的“信息转换原理”就是把信息资源转换为智能能力产品的理论, 包括以下几方面:
(1) 把只考虑形式因素(因而主要适合于通信领域的)信息论拓展成了形式-内容-价值三位一体(因而适用于全部信息过程)的“全信息理论”, 完善了信息的理论.
(2) 总结了知识的生态理论, 包括知识的内部生态和外部生态理论.
(3) 注意到“知识的外部生态规律——信息-知识-智能转换(简称信息转换)”正是生成智能的普遍机制, 由此建立了基于信息转换的人工智能机制模拟方法; 证明了结构模拟、功能模拟、行为模拟方法都和谐统一于机制模拟方法, 从而建立了人工智能的统一理论.
(4) 注意到现行人工智能忽略了意识和情感, 提出了意识、情感、理智三位一体的高等人工智能系统 模型(其中的理智就是现行的人工智能); 并且证明了高等人工智能的所有要素(注意能力、基础意识能力、情感能力、理智能力和综合决策能力)的生成机制分别是在各自条件下的信息转换,从而建立了基于信息转换原理的高等人工智能理论.
(5) 上述成果表明: 信息转换原理就是信息、知识、智能的一体化理论, 它使原先互相隔离的信息理 论、知识理论、智能理论得以全面沟通. 从把资源转 换为产品这个历史使命判断, 信息转换、质量转换、 能量转换三者具有同等重要的科学意义和实践价值.
参考文献略
本文摘自《科学通报》2013.14期
张亚勤、刘慈欣、周鸿祎、王飞跃、约翰.翰兹联合推荐
这是一部力图破解21世纪前沿科技大爆发背后的规律与秘密,深度解读数十亿群体智能与数百亿机器智能如何经过50年形成互联网大脑模型,详细阐述互联网大脑为代表的超级智能如何深刻影响人类社会、产业与科技未来的最新著作。
《崛起的超级智能;互联网大脑如何影响科技未来》2019年7月中信出版社出版。刘锋著。了解详情请点击:【新书】崛起的超级智能:互联网大脑如何影响科技未来
未来智能实验室是人工智能学家与科学院相关机构联合成立的人工智能,互联网和脑科学交叉研究机构。
未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)云脑研究计划,构建互联网(城市)云脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。
如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”