周剑铭,自由学者。研究方向为中西文化比较研究,智能哲学,算法、不确定性和不确定性问题(NP)理论。
柳渝,法国儒勒·凡尔纳公立综合大学计算机(Département Informatique, UFR des Sciences, Université de Picardie Jules Verne, France)系副教授。研究方向为智能哲学,算法、不确定性和不确定性问题(NP)理论,NP问题实际求解算法。
我们的文章“智能哲学:‘第三问题’与图灵的‘模仿游戏’”一文[1]着重指出了图灵提出的“模仿游戏”的真正意义和价值,揭示人、机之间的复杂层次关系,本文结合我们对当前人工智能中“机器学习”问题的研究,进一步讨论“机器”与“学习”之间所隐含的人、机复杂关系。我们从图灵的一贯思想出发,发微图灵论文“计算机器与智能”[2]中所包含的丰富思想,特别是文章中第7章的内容。很明显,作为当前人工智能主流的“机器学习”与图灵所探讨的“学习机器”,其思考的角度和深刻性完全不同,启迪良多。
一、“亚临界”状态“和“超临界”状态
在“计算机器与智能”这篇文章的第7章Learning Machines,图灵总结了对机器不能“思考”这种谬论的反驳,但他的论证是有底线的,他真正关注的方面不是机器的“功能”(思考)如何如何,而是机器的“状态”,在他看来,机器的“纯机械”方式,如钢琴演奏或剥洋葱一样:“绝大多数思想都处于‘亚临界’状态,对应于处于亚临界体积的反应堆,一个想法进入这样的思想中,平均下来只会产生少于一个的想法”,但是“有一小部分思想处于‘超临界’状态,进入其中的想法将会产生二级三级越来越多的想法,最终成为一个完整的’理论。
动物的头脑显然是处于亚临界状态的。由于这种相似性,我们不得不问:’一个机器能不能做成超临界的?’” 图灵所说的这个“超临界”的状态,在我们看来,就是指现在不同于“机械步骤”(计算机)的“人工智能”的核心理论问题。
图灵认为,“亚临界”状态和“超临界”状态之间的区分和定义是非常困难的,图灵并不以为所有的这些争论已经解决了关于人的思维与机器思维的相同与不同的问题,这里既有公众对这个问题的关心所包含的模糊性(图灵努力地进行了分析),也有这个问题的自身本质上的问题,图灵承认:“These last two paragraphs do not claim to be convincing arguments. They should rather be described as ‘recitations tending to produce belief’”(上面两段并没有宣称是令人信服的论据,更应该被看作是“为了产生信仰的背书 ”,——即对立的观点的争论不过是背颂各自的宗教式的教条)。
实际上,图灵的思考并未过时,人工智能研究中的两条道路始终存在,一方面,以“联接主义”为名,代表了重视物理关系(硬件)的一方,另一方面则是以“符号主义”为名的重视算法(软件)的一方。重要的不是这两方的对立,而是这两方都有无法克服的困难,特别是双方无法沟通所形成的思想上的混乱,令人不安地再次想起“明斯基的咒语”。
尽管今天的“机器学习”取得了巨大的成功,但在这个领域最前沿工作的专家仍然承认,无法理解和解释最基本的人工神经网络模型(ANN)的机理;另一方面,除了模拟神经元-突触的ANN模型,迄今没有产生通用的Agent 硬件,现在人工智能研究大多是在电子计算机中的建模(函数化)进行的,“人工智能”与“计算机”究竟有何不同,成了公众和专家们共同的困惑。
2017NIPS (神经信息处理系统大会 Conference and Workshop on Neural Information Processing Systems,关于机器学习和计算神经科学的国际会议)上,"Test of Time"(时间检验奖)论文大奖获得者Ali Rahimi 在演讲中[3],把“机器学习”称为“炼金术”(Alchemy),类似的看法或对立性的争议在学术界一直没有中断过。Rahimi 引用吴恩达的话: “Artificial Intelligence is the new electricity”,(机器学习就是新时代的电力),他们的意思是说,现在的AI研究只是纯粹的技术活,整个AI缺泛严格性和一致性的理论基础,未能成为非常稳固、有规律、有系统理论的知识体系。
Rahimi以后解释说,炼金术问题和黑箱问题的区别在于,“一个机器学习系统是黑箱”和“整个领域变成了黑箱”。与此对立的观点,如Facebook的首席人工智能科学家Yann LeCun则认为[4],工程技术上创新可以从乱糟糟中带来核心的理解,加州大学伯克利分校Benjamin Recht教授也认为有条不紊的研究和大胆开拓的研究可以达到一个平衡,“我们两者都需要”。
在此之前和之后,许多科学家表达了类似的看法和与此有关的剧烈论争,但所有这些对立的观点都承认,AI研究必须要有坚实的理论基础才能成为完整的科学理论体系,但现在的问题在于,我们不知道解决问题的方向,这种困惑几乎一直伴随着人工智能的发展历史。我们认为,可以从图灵的思想中去寻找启示,把当前作为工程技术的“机器学习”与图灵对“学习机器”的本质性思考结合起来,以获得理论研究方向上的灵感。
二、“学习机器”与“机器学习”
“学习机器”(图灵)与“机器学习”(当前AI的主流工作)这两个概念的不同就在于人(研究者)在人、机关系中的地位,也就是我们一直重视的人、机伦理关系。我们强调,图灵一直是作为机器的创造者角色进行思考的,他主要思考的是机器的“状态”,所以他细致地分析了机器的“亚临界”与“超临界”这两种状态,以我们现在习用的术语来说,这就是“线性的”和“非线性的”(指数的)两者本质的不同。
图灵始终以创造者的身份考虑“学习机器”的可能与不可能。对于他来说,算法与“机械步骤”都是功能性的,即“能行的”、“线性的”,对于专家或普通人这都不成为问题,真正的问题是:"一个机器能不能做成超临界的?" 而且图灵认识到,这个问题的最大困难在于,从工程学的角度上,无法回答这样的问题,以我们今天的理解,就是说,这是人的问题而不是机器的问题。
但当前人工智能研究的真正核心问题似乎还没有被人意识到,人们关心的只是如何发明、设计更好的算法,“机器学习”大部份研究几乎集中于此,所以称之为“电力”或“炼金术”并不冤枉,“机器学习”并不关心“机器学习”的本质是什么,从来没有像图灵一样反思过:“一个机器能不能做成超临界的?”,在他们意识中,似乎只要不断地“试错”下去,一定能让“猴子打出文章来”。
由此我们可以看到,这两个术语区别的重要性,特别是对这两者不加分析地混同,就隐藏或误导了人工智能研究中的本质性问题,实际上这个问题也是科学哲学的基本问题。
“试错”作为一种工程实践在以客观性和实证性为本质的科学领域内最终能产生突破性的成功,甚至引起“范式革命“ ,最终是以人的基本认知的转变,甚或以人的代际之间的替代为代价的,对于基本理论或概念的缺失,不能由“试错”产生。不能成为纯粹客观性和实证性的对象不是科学能力所及的,“智能”作为一个抽象的概念,不能成为科学研究对象。因此,在不知“智能”为何物,或者不能清楚地定义“人的智能”与“人工智能”这两个概念的情况下,想创造研究“智能”的显微镜、试验仪器、试验室或研究方法之类的想法,实际就是事先肯定了“人可以制造超临界的机器”的能力,这本身就是对科学精神的违背。
由此可以看出,“机器学习”与图灵的“学习机器”这两个概念在本质上有别,如何认识这两者的相同与不同,具有重要的实际意义。科学家习惯以科学思维方式工作,这是科学基本精神的人文价值,但以科学的客观性、实证去顶替人文精神,把“科学”当作一个咒语,用在人类所面临的一切,包括人类自身的价值、意义、命运上,这种以科学之名的狂妄与图灵的自知之明(Entscheidungsproblem)无法相比。
三、对图灵的文章的直译、意译与释译
图灵的工作和文章的价值远没有得到充份的认识,当然图灵也不可能清楚、充份地回答所有的相关问题,但图灵对人类的能力的自知之明永远不会过时。解读图灵的文章时,理解他的思想、认知更重要。对图灵文章需要专研,在读、释中,如何深入地去理解图灵简短表达后的层次复杂性,不仅是语法语义问题,也是对历史的发掘(“知识考古学”——福柯),这是对历史的负责,更可以成为对现在和未来思考的灵感之源。
我们研读图灵文章时始终重视文章中隐含的多层次的复杂性,比如,对当时图灵写作基本思想的一致性和基本认知的理解,这可以举一段图灵原文的叁种不同的理解和译法作为例子:
原文:As I have explained, the problem is mainly one of programming. Advances in engineering will have to be made too, but it seems unlikely that these will not be for the requirements.
直译法:正如我所解释,问题主要是编程,工程上的进步也是需要的,但这种所需不被满足的可能性似乎不大。
意译法:正如我所解释过的,(现在的)问题主要是编程这一方面,虽然作为(计算机)工程上的问题应当受到(与编程)同样的关注,但这似乎不大可能,因为这些(“编程”和“工程”两者)无法(结合在一起而)胜任这种要求。
释译法:按意译所隐含的对应,one of programming的另一方,是工程(硬件)上的要求,这里的but it seems unlikely中的it 就是指Advances in engineering,it will have to be made too,注意这个Advances不是Advance的复数,Advances是“求爱、热切的要求”的意思,是单数名词,与it对应;后面that 是表达seems unlikely原因的状语子句,因为 these (软件和硬件)will not be adequate for the requirements,即, “工程”(硬件)与“编程”(软件)不能满足同时结合起来讨论的要求(for the requirements)。
以现在的方式理解,这是对创造机器能力的人的能力而言,硬件的创造不是机器的能力而是人的能力,图灵始终是作为一个机器创造者(人类身份)而考虑人类的能力问题。编程只是“炼金术”级别,即使在硬件條件简单的情况下,也是可以讨论的。此句以下,图灵分析了当时硬件條件下可以只考虑的“学习机器”问题。
四、成人的“学习”与儿童的“教育”
图灵区别成人的学习与儿童接受教育,虽然两者都可以名之“学习”,但图灵认为成人大脑所经历的经验不同于儿童大脑接受教育的性质,就是说,这相当于“超临界”状态与“亚临界”状态的不同。因此,“与其试图编程模拟成人大脑,不如模拟儿童大脑”,现在看来很明显,成人的学习是“学而时习之”的个人历史经验过程,儿童的教育具有被动学习的性质,主要依靠记忆和训练。但即使是这样,“儿童机器”的教育仍不同于机械的“学习机器”,儿童在教育过程中的变化是受教育者的责任约束的,人类对儿童的的教育具有类似于“自然选择”的重大责任。
图灵虽然是一个技术理论专家,却充满人文关切的伦理精神:“It will not be possible to apply exactly the same teaching process to the machine as to a normal child. …… The example of Miss Helen Keller shows that education can take place provided that communication in both directions between teacher and pupil can take place by some means or other. ” (对机器不可能应用与正常儿童完全相同的教学过程,……海伦.勒女士的例子表明只要老师和学生能够以某种方式进行双向的直接交流,教育就能进行)。今天,在我们面临AI基本理论问题和受到人、机伦理挑战的困惑的时候,图灵比我们清醒多了。
五、规则与规则的规则
对于“机器学习”而言,算法、指令、逻辑、规则等具有相同的本质,但图灵对创造“学习机器”,特别是“儿童机器”而言,“规则”与“规则的规则”具有完全不同的意义,图灵认为,这是人工智能的基本性质:
The imperatives that can be obeyed by machine that has no limbs are bound to be of a rather intellectual character, as in the example (doing homework) given above. important amongst such imperatives will be ones which regulate the order in which the rules of the logical system concerned are to be applied, For at each stage when one is using a logical system, there is a very large number of alternative steps, any of which one is permitted to apply, so far as obedience to the rules of the logical system is concerned. These choices make the difference between a brilliant and a footling reasoner, not the difference between a sound and a fallacious one.
-没有肢体的机器人(AI,Agent)所能执行的指令具有智力性质,……在这些指令中,最重要的是调节逻辑系统规则的执行顺序,因为在使用这个系统的每一步,都会有许多不同选择,在遵守逻辑系统规则的情况下,任意选择一个都是允许的。如何选择将区分聪明推理者还是愚蠢推理者(Agent),而不是区分正确推理者还是谬误推理者(计算机)。
如果我们真正理解了图灵的这种思想,就不会为无法区分作为Agent 的AI 与计算机的能力问题而烦恼。
六、不确定性与人工智能基本问题
我们的NP理论[5]坚持图灵对希尔伯特第十问题解决的基本意义,理解线性(P定义)与非线性(NP定义)分别是最基本的本质的区别,任何以P等于或不等于NP为目的前提、假设或猜想,都是循环定义或循环论证的错误。人类只能在线性与非线性之间建立最优近似性联系(NP-algorithm),但这不能以牺牲“线性”和“非线性”自身本质为代价。这种基本认知问题上的误导,就会产生以“停机问题”替代“不可判定问题”,以“图灵检验”替代“模仿游戏”。因此可以说,这些都是以“炼金术”取代基本概念和基本理论问题研究。
图灵提问:“一个机器能不能做成超临界的?” 实际就是希尔伯特第十问题在人工智能领域的再版化。正是尊循图灵一致性的思想,我们把算法理论、NP理论自然地延申到人工智能领域,有关这些问题,我们在“智能哲学”中进行深入讨论。
参考资料:
1. http://www.aisixiang.com/zhuanti/495.html
2. A.M. Turing, Computing machinery and intelligence, Mind,59, 433- 460,1950.
3. https://mp.weixin.qq.com/s__biz=MzA3MzI4MjgzMw==&mid=2650734337&idx=2&sn=a0482d8899df629a8b1e8c51d302fe2e&chksm=871b3b7fb06cb2697b4dafe698ef87256d49b72a78a7c3cd10563890edda02adb525d9480471&scene=0&key=57525b5230b75ef7f8d3197a7a096eee12021e31be3b4e863872af2b768b84f3ca7ad830a9e52d3f6963ad76871fdb6e6f478f02a04a20ea4ab84682bee4e71775e51612857a0d8dab789feb98285bae&ascene=0&uin=MTY1NzgxNjIyMg%3D%3D&devicetype=iMac+MacBookAir7%2C2+OSX+OSX+10.11.6+build(15G1611)&version=12020810&nettype=WIFI&fontScale=100&pass_ticket=FuwY1I1ZwTdtzuygXfj8oQ3sbx2mbbuoMkvag5lwjl55D%2BAbF7fEqVeGWQ1ooFcU
4.https://www.facebook.com/yann.lecun/posts/10154938130592143
5.http://blog.sciencenet.cn/home.php?mod=space&uid=2322490&do=blog&classid=172041&view=me&from=space
未来智能实验室是人工智能学家与科学院相关机构联合成立的人工智能,互联网和脑科学交叉研究机构。
未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)云脑研究计划,构建互联网(城市)云脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。
如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”