“NP问题是可计算的吗?” - 从“可计算性”的角度审视NP

来源:图灵人工智能

转自 http://blog.sciencenet.cn/u/liuyu2205

P vs NP世纪难题显示出在现有的计算机理论中存在着令人不安的困惑:一方面,书本中的NP问题理论部份无论是学习或教学都感到困难,以至于人们不得不一次又一次回头去重新学习或思考,但或者失望而返,或者强迫自己服从这些权威论述;另一方面,现有的NP问题理论与实际工作几乎完全脱节,甚至有人说完全可以不用此理论。进一步,包含现有的NP问题的计算机理论无法与正蓬勃发展的人工智能理论衔接。

自2015年开设博客“不确定性的困惑与NP理论”以来,特别是2020年困难而特殊的一年,承蒙大家的热情支持和慷慨的帮助!这里,我们与大家分享关于P vs NP问题研究工作总结性的文章:“NP问题是可计算的吗?”- 从“可计算性”的角度审视NP,希望对理清P vs NP问题的认知纠缠有所帮助,并祝大家新年愉快,来年顺利,。。。

题目: “NP问题是可计算的吗?”

- 从“可计算性”的角度审视NP

周剑铭 柳渝*(yu.li@u-picardie.fr)

MIS, Université de Picardie Jules Verne, 33 rue Saint-Leu, 80090 Amiens, France

一,引言

二,NP定义溯源

三,现有的“可计算性”:“NP问题是穷举法可计算的”

1,NP的形式定义

2,分析NP的形式定义

3,现有的“可计算性”所隐含的矛盾:“图灵机”与“可计算问题”

四,图灵的“可计算性”:“NP问题是穷举法可计算的吗?”

1,Entscheidungsproblem溯源

2,基于“可计算序列”的“判断问题”

3,“可计算序列”,“计算机器”与“可计算问题”

4,“NP问题是穷举法可计算的吗?”

五,案例研究:现有的“图灵机” vs 图灵的“计算机器”

六,“判定问题”与“判断问题”:判断的主体

七,结语

一,引言

在现有的计算机理论中,P(Polynomial time)指“图灵机在多项式时间可判定的问题类”,但是对NP(Nondeterministic Polynomial time),情况却复杂得多,首先有一个教科书式的定义,“NP是不确定性图灵机在多项式时间可判定的问题类”( NP is the class of problems decidable by Non-Deterministic Turing Machine (NDTM ) in polynomial time - 定义1),后来又发展出一个更通俗化的定义,“NP是图灵机在多项式时间可验证的问题类”(NP is the class of problems verifiable by TM in polynomial time - 定义2)。于是,P vs NP问题被一般性表达为:NP=P?即多项式时间可验证的问题(NP)是多项式时间可判定的问题吗(P)? [1][2]

P vs NP问题成为计算机理论的重大的未解难题,还被Clay Mathematics Institute收录为七个千禧年难题之一。Gasarch于2002年,2012年和2019年对P vs NP问题的前途进行了三次调查 [3],表明人们为寻找求解NP问题的多项式时间算法付出了巨大的努力,以求一举解决P vs NP难题,但是迄今为止并没有出现有价值的进展方向。

Hemaspaandra在介绍Gasarch的第二次调查时说 :我希望在遥远的未来,当人们读到这四篇文章(指介绍P vs NP问题的四篇文章),可以帮助他们了解,在“P vs NP”还没得到解决的黑暗年代里人们的思想状态(I hope that people in the distant future will look at these four articles to help get a sense of people’s thoughts back in the dark ages when P versus NP had not yet been resolved) [4]。

P vs NP问题的难点集中在对NP的认知上,表达为NP定义,关于NP的定义缠绕了计算机基本理论几十年,比如,Scott Aaronson在博客“The Scientific Case for P≠NP”说:似乎有一个“看不见的电围栏”把P问题与NP完全的问题区分开(there seems to be an "invisible electric fence separating the problems in P from the NP-complete ones) [5]。

由流行的NP定义得出:“NP问题是穷举法可计算的”,也就是说,NP定义的本质是对NP问题的“可计算性”的判断。然而,“可计算性的判断”是可计算性理论的核心议题,整个计算机理论由此展开,可是对于“NP问题的可计算性的判断”,如此重要的议题,却几乎未见学术界展开讨论过。本文追本溯源回到图灵1936年那篇奠基可计算性理论的论文《论可计算数及其在判定问题上的应用》(On Computable Numbers, with an Application to the Entscheidungsproblem)[6],对比现有的“可计算性”与图灵的“可计算性”,解读流行NP定义,探讨其对NP问题的“可计算性”判断的有效性,我们将看到对此质疑:“NP问题是穷举法可计算的吗?”

二,NP定义溯源

NP作为概念“Non-deterministic Polynomial time”的提出源于柯克1971年那篇奠基性的论文,文中柯克提出后人称之的“柯克定理”,即论文中的定理1 [7]:

定理1:如果一个符号串集合S被某种不确定性图灵机在多项式时间内接受,那末S可以被P-归约到{析取重言式}。

(Theorem 1 If a set S of strings is accepted by some nondeterministic Turing machine within polynomial time, then S is P-reducible to {DNF tautologies}.)

由此,得出NP的第一个流行定义:

定义1 : NP is the class of problems decidable by NDTM in polynomial time。

在柯克的论文中,NDTM原指由“神谕机(Oracle Machine)”与“图灵机(Turing Machine)” 混合而成的“查询机(Query Machine)”,查询机的计算行为被解释为:对于一个NP问题实例,神谕机“可解”,此“解”可由图灵机多项式时间“验证”。然而,由于神谕机不是构造性的机器模型,在现实中并不存在,为了将神谕机从NDTM中排除,学界遂将NDTM的计算行为解释为“猜测+验证” [8]  ,即对于一个NP问题实例,NDTM在多项式时间“猜测”出一个候选解,并能在多项式时间“验证”。经过这样的解释,NDTM就从“查询机”变成了现在的“多选择的NDTM”,即相对于在计算的下一步只有“唯一的选择”的TM,NDTM可以有“多选择” [9]。于是,得到NP的第二个流行定义:

定义2 : NP is the class of problems verifiable by TM in polynomial time。

定义1与定义2被认为等价 [10],NDTM又被解释为与TM等价,“Every nondeterministic Turing machine has an equivalent deterministic Turing machine”(Sipser书,Theorem 3.16), 于是有了一个非形式的“承认”:TM在指数时间内模拟NDTM的计算。 

由此人们很快就认可,NDTM的计算行为与“穷举法”等同,这样NP又被解释为“NP是穷举法可计算的问题类”,毕竟P与NP不同,于是就有了“NP问题是可计算的,但难计算的”这样的流行观念。

不管以后的解释如何,在直觉认知上,NP与P是不同的,但是NP的定义又给人NP与P等价的指望,这就是P vs NP问题的困难之源。

三,流行的“可计算性”:“NP问题是穷举法可计算的”

首先,我们讨论NP的形式定义。

1,NP的形式定义

这里我们考虑Papadimitriou的书“计算复杂性”的第9章给出的NP的形式定义 [11],Cook在为Clay Mathematics Institute介绍P vs NP问题时也给出了类似的定义 [1]:

- 令R为二进制字符串的关系; 即,让R为一组有序对(x,y)的集合,其中x和y是二进制字符串。 如果存在确定性图灵机在多项式时间内判定给定的(x,y)是否在R中,我们则说R是“多项式可判定”。如果 k >= 1, 使得对于R中的所有(x,y),y的长度(我们写为| y |)最大为|x|^k,则R是“多项式平衡”。(Let R be a relation on binary strings; i.e., let R be a set of ordered pairs (x,y) where x and y are binary strings.  We say that R is "polynomially decidable" if there is a deterministic Turing machine that decides in polynomial time where a given (x,y) is in R.  We also say that R is "polynomially balanced" if there is some k >= 1 such that for all (x,y) in R, the length of y (which we write as |y|) is at most |x|^k.)

- 现在我们准备定义NP。 语言L在NP中,当且仅当存在多项式可判定且多项式平衡的关系R,使得语言L = {x : (x,y)在R中存在y}时。(Now we are ready to define NP.  A language L is in NP if and only if there is a polynomially decidable and polynomially balanced relation R such that L = {x : (x,y) is in R for some y}.)

2,分析NP的形式定义

NP的形式定义涉及集合L和R,让我们以SAT,典型的NP问题为例,从解读L和R开始。

2.1 集合L和R

考虑2个SAT实例:

f1 = (x1 ∨x2 ∨x3)∧(x1 ∨x2 ∨¬x3)∧(¬x1 ∨¬x2 ∨  x3) ∧ (¬x1 ∨ x2 ∨ x3),f1有3个变元,共2^3=8个变元赋值组合,其中4个是f1的解,R = {(f1,(0 1 0)), (f1,(0 1 1)), (f1,(1 0 1)), (f1,(1 1 1))}。

f2= x1 ∧¬x1, 1个变元,共有2个变元赋值的组合,f2无解,R = Ø。

对于L,f1可满足,在L中;f2不可满足,不在L中,故L = { …, f1, …}。

所以,R是SAT的给定实例的所有解的集合,而L是SAT的所有可满足的实例的集合:

- R = {(x,y) : x是SAT的实例,y是x的解}

- L = {x : 存在某个y,使得(x,y) 在R中} 

下面我们按照这个方法定义SAT,很快能看到,P面向“判定问题”,而NP面向“判断问题”。

2.2 “判定问题”与“判断问题”

记集合A = {x :G(x)表示x满足某种性质},表达元素x与集合A的所属关系,即“整体中个体”,而判断x是否在A中,即判断元素x是否具有性质G(x)。

从这个理解出发,SAT呈现出二个层次上的定义:

判定问题:穷举法判定SAT问题的给定实例x是否可满足。这相当于,穷举法判定x的给定候选解y是否在R中。

判断问题:如果穷举法可以判定SAT实例(R),那么穷举法是否可以判定SAT问题(L)?

可见,“判定问题”面向“实例”(个体,R),而“判断问题”面向“问题”(整体,L),所以NP的形式定义是基于对“判断问题”的回答。实际上,我们也能看到,这个回答才是造成现有的NP定义的困难的根源。

对于“判定问题”,通过枚举SAT实例x的所有候选解y,重复调用多项式时间验证解的图灵机M,就可以在指数时间判定x是否可满足,所以穷举法对判定SAT实例x具有可计算性。

但要注意,这个意义上的“穷举法”并没有产生一个新的图灵机与之对应,就是说,不过是重复调用多项式时间验证解的图灵机M,因此这里的“指数时间”只是表达重复调用M,是一个由“人”暗中定义了的“指数时间复杂度”。所以,“判定问题”的本质是“P问题”。

根据NP的形式定义,“语言L在NP中,当且仅当存在多项式可判定且多项式平衡的关系R,使得语言L = {x : (x,y)在R中存在y}”,就是说,“穷举法”判定SAT实例与“穷举法”判定SAT问题等价,换句话说,在“判定问题”与“判断问题”之间建立起了越界的等价关系!

这也正是NP的非形式定义1与定义2“等价”所表达的意义:“NP is the class of problems verifiable by TM in polynomial time”与“NP is the class of problems decidable by NDTM in polynomial time”等价。

所以,流行NP定义是对NP问题的“可计算性”的直接肯定,而非论证,实例与问题的关系从“整体中的个体”变成了“个体即整体”,“判断问题”因此被取消了,从而失去了揭示NP本质的可能性,暗含NP=P。下面我们从现有的“可计算性”观念中追究更一般性的原因。

3,流行的“可计算性”所的隐含的矛盾:“图灵机”与“可计算问题”

在现有的计算机理论中,“可计算问题”被解读为,“可计算问题是由’停机’的图灵机计算的问题”,图灵机的“无限长的纸带”被解读为“无限的时空”,所以图灵机的计算被解释为“不计时空开销”。这样的“可计算问题”在“理论上”似乎是可计算的,但“物理上”却不一定是可计算的。

“图灵机模型使用无限长纸带作为其无限内存,有一个读写头。最初,输入字符串被放置纸带上,纸带的其他方格均为空白。机器将继续计算,直到决定产生输出为止。 通过进入指定的接受和拒绝状态来判断是否接受和拒绝输入,如果图灵机不进入接受或拒绝状态,则将永远持续下去,永不停止。[10](Sipser书,Theorem 3.16)”

- The Turing machine model uses an infinite tape as its unlimited memory. It has a tape head that can read and write symbols and move around on the tape. Initially the tape contains only the input string and is blanc everywhere else. If the machine needs to store information, it may write this information on the tape. To read the information that it has written, the machine can move its head back over it. The machine continues computing until it decides to produce an output. The outputs accept and rejet are obtained by entering designated accepting and rejecting states. If it doesn’t enter an accepting or a rejecting state, it will go on forever, never halting. 

既然图灵机的计算“不计时空开销”,那么“穷举法”计算NP问题的实例与计算NP问题(任意实例)就没有区别,这就是“判定问题”与“判断问题”之间越界的等价关系的来源!

现在让我们追本溯源回到图灵的可计算性理论,考察“NP问题是穷举法可计算的”有效性。

四,图灵的“可计算性”:“NP问题是穷举法可计算的吗?”

作为计算机理论的核心概念,“可计算性”表达了“算法”普遍性的解决问题的过程性能力,对这种过程性能力的考察被数学家隐含地表达出来,这就是著名的希尔伯特(David Hilbert 1862─1943)的Entscheidungsproblem:是否存在“通用过程”来判定任何可定义的数学问题可解。

Entscheidungsproblem 这一词由于历史时间不同,具有不同的具体表达形式。

1,Entscheidungsproblem溯源

Entscheidungsproblem源于希尔伯特1900年所作的《数学问题》的著名讲演,其中提出了数学理论中的23个最困难的问题,第10问题是这样说的[13]: Given a Diophantine equation with any number of unknown quantities and with rational integral numerical coefficients: To devise a process according to which it can be determined in a finite number of operations whether the equation is solvable in rational integers. 

作为一个大数学家希尔伯特并没有用“数学方法”、“函数”或“形式方法”这样现成的术语,而是问:能否“设计一个过程”(To devise a process)来“判定”(determine)任何一个丢番图方程问题是否可解?

在1936年的文章中,图灵证明:不存在“通用过程”判定任何一阶谓词公式可证。

2,基于“可计算序列”的“判断问题”

为此,图灵理解性说[6] :对这样一个“通用过程”的问题可以表达为通用过程判定给定的整数n是否具有性质G(n)的问题(比如,G(n)可能表示“n是可满足的’’或“n是一个可证明公式的Godel表达),这相当于计算一个数,如果G(n)为真,其第n个数字为1;如果G(n)为假,其第n个数字为0。”(For each of these "general process" problems can be expressed as a problem concerning a general process for determining whether a given integer n has a property G(n) [e.g. G{n) might mean "n is satisfactory" or "n is the Godel representation of a provable formula"], and this is equivalent to computing a number whose n-th figure is 1 if G(n) is true and 0 if it is false.)

与上述基于“语言”的NP的形式定义相比,图灵引入了“可计算数(序列)”(computable numbers/sequence)概念,表示机器写下的所有实例的计算结果,而将给定实例的计算结果置于此序列中,表达了实例与问题的“整体中个体”的关系,也就是说,“判定问题”包含在“判断问题”中。

“可计算数(序列)”成为图灵工作的红线,贯穿于整个论文中,正如 Charles Petzold在其书The Annotated Turing所说[12]:

- “尽管解决Entscheidungsproblem确实是图灵写这篇文章的动机,但是这篇长篇大论本身讲的却是’可计算数’。在图灵的定义中,可计算数就是可以使用机器计算的数。论文前面60%的内容都是对可计算数的探索。”

让我们考察图灵是如何从“可计算数(序列)”出发定义“可计算性”的。

3,“可计算序列”,“计算机器”与“可计算问题”

图灵在论文开篇提出“可计算数”(computable numbers),强调是由机器写下来的 [6] :

- 按照我的定义,一个数是可计算的,如果它的十进制的表达能被机器写下来。(According to my definition, a number is computable if its decimal can be written down by a machine. )

接着,图灵将人计算实数与机器计算过程进行比较,构造出作为现代计算机模型的“计算机器”(computing machine),写下“可计算数(序列)”(computable number/séquence):

- 如果一台机器打印两类符号,第一类(称为数字)全是0和1,其它被称为第二类符号,则机器将被称为“计算机器”。如果给机器装置一条空白纸带,让它运动起来,从正确的初始m-格局出发,机器打印的第一类符号的子序列称作机器计算的序列;在表达为二进制的十进制实数前放上小数点,称作机器计算的数。(If an a-machine prints two kinds of symbols, of which the first kind (called figures) consists entirely of 0 and 1 (the others being called symbols of the second kind), then the machine will be called a computing machine. If the machine is supplied with a blank tape and set in motion, starting from the correct initial m-configuration, the subsequence of the symbols printed by it which are of the first kind will be called the sequence computed by the machine. The real number whose expression as a binary decimal is obtained by prefacing this sequence by a decimal point is called the number computed by the machine.)

图灵进一步区分Circular machine和Circle-free machine:

- 如果计算机器只写下第一类有限数目的符号,被称作“Circular”;否则,被称作“circle-free”。(If a computing machine never writes down more than a finite number of symbols of the first kind it will be called circular. Otherwise it is said to be circle-free.)

然后,再用Circle-free machine的计算过程明确定义“可计算数(序列)”(Computable sequences/numbers)

- 一个序列被说成“可计算的”,如果能够通过一台“circle-free machine”计算而得。一个数是“可计算的”,如果它与由“circle-free machine”计算的数只差一个整数。(A sequence is said to be computable if it can be computed by a circle-free achine. A number is computable if it differs by an integer from the number computed by a circle- free machine.)

并且说:

- 为了避免混淆,我们更经常说可计算序列,而不是可计算数。(We shall avoid confusion by speaking more often of computable sequences than of computable numbers. )

这样,“可计算序列”在“算法(计算机器)”与“问题”之间建立起可能存在的某种“实质性”的联系,“可计算问题是计算机器写下可计算序列的问题”。由此,图灵的“可计算性”表达了“通用性”,“整体性”和“实时性”。

对比上述流行的“可计算问题”,图灵定义的“可计算问题”不仅在“理论”上是可计算的,而且在“物理”上也是可计算的


4,“NP问题是穷举法可计算的吗?”

从图灵的“可计算性”的角度,SAT表达为“判断问题”: 

判断问题:是否存在计算机器判定SAT的给定实例fn可满足,这相当于计算序列αL = G(f1)G(f2)G(f3)... G(fn)…(G(fn)表示fn是可满足的实例),如果G(fn)=1,fn是可满足的;否则,fn是不可满足的?

所以考察“穷举法”对SAT问题是否具有可计算性,就是考察“穷举法”能否写下SAT问题的可计算序列αL = G(f1)G(f2)G(f3)…G(fn)…。

如以上分析,“穷举法”判定SAT的给定实例,是通过重复调用多项式时间验证解的计算机器M而具有“指数时间复杂度”,所以“穷举法”的本质就是计算机器M,而“穷举法”的指数增长的计算开销能否胜任SAT的实例规模的增长,即能否计算αL = G(f1)G(f2)G(f3)…G(fn)…成为了“问题”,换句话说,多项式时间验证解的计算机器M对SAT问题是否具有可计算性成为了“问题”,是有问题:“SAT是穷举法可计算的吗?”

实际上,对“SAT是穷举法可计算的吗?”的判断进入了计算复杂性理论的论域,而对SAT的“可计算性”的一般性判断则与图灵论文的主题希尔伯特的Entscheidungsproblem密切相关,需要专门讨论,不是本文的主题。

五,案例研究:现有的“图灵机” vs 图灵的“计算机器”

为了进一步理解现有的“可计算性”与图灵的“可计算性”的区别,我们以判定任意自然数的奇偶性为例,对比“图灵机”与图灵的“计算机器”。

1,“图灵机” 

判定问题:判定所有的自然数n的奇偶性,这相当于判定任意的自然数n是否在偶数集合A中,A = {n : mod(n, 2)=0}。

比如n=2,mod(2, 2)=0,故2在A中;n=3,mod(3, 2)/=0,故3不在A中。

这里,假设输入的自然数用“真数”表示:1(1),2(11),3(111),。。,;输出1表示偶数;输出0表示奇数。

图灵机M1的规则表:

q1, 1, #, R, q2

q2, 1, #, R, q1

q1, #, 1, R, qY

q2, #, 0, R, qN

q1表示“初始状态”,qYt表示“接受状态”, qN表示“拒绝状态”,qY与qN都是“停机状态”。

模拟M在输入(n=2)的运行:

开始的纸带放置11( Rule ):

 1   1   #   #   # …

内态的变化:

q1 q2  q1 qY.

纸带的变化:

#   #   1   #  # …

模拟M在输入(n=3)的运行:

开始的纸带放置任给的一个自然数:

 1   1   1   #   # …

内态的变化:

q1 q2  q1 q2 qN.

纸带的变化:

#   #   #   0  # …

2,图灵的“计算机器”

根据图灵对“判断问题”的表达:

判断问题:判定所有的自然数n的奇偶性(G(n)表示n是偶数,n mod 2 = 0),这相当于计算序列010101…,如果G(n)为真(偶数),序列的第n个数字为1;如果G(n)为假 (奇数),序列的第n个数字为0。

其可计算序列记为,α = G(1)G(2)G(3)…G(n),。。。= 010101…

G(1)=0    (n=1, 奇数)

G(2)=1  (n=2, 偶数)

G(3)=0    (n=3, 奇数)

。。。

图灵在论文中给出的第一个“计算机器”的例子就是计算序列010101…,但图灵是将此序列作为十进制数0.333…的二进制数表示,所以没有考虑输入数据,纸带的输入只是空白符号“#”(blank),其对应的“计算机器”的规则表如下:

q1, # , 0, R, q2

q2, # , # , R, q3

q3, # , 1, R, q4

q4,# , # , R, q1

模拟此机器的运行:

#   #   #   #   #   #  …

q1 q2 q3 q4 q1 q2 …

0   #   1   #   0   #  …

我们将序列010101…作为对所有自然数(1,2,3,…)奇偶性的判断结果,纸带上的输入数据是用“真数”表示的所有自然数:1(1),2(11),3(111),。。,;输出1表示偶数;输出0表示奇数。

所以需要上述计算机器M1的规则表略作修改成M2:

q1, 1, #, R, q2

q2, 1, #, R, q1

q1, #, 1, R, q1

q2, #, 0, R, q1

此机器的初始状态是q1,没有停机状态。在q1状态下遇空白符“#”,写下“1”,表示输入的自然数是偶数,然后回到初始状态q1;q2状态下遇空白符“#”,写下“0”,表示输入的自然数是奇数,然后回到初始状态q1,继续判断纸带上的下一个自然数。

模拟此“图灵机”的运行:

开始的纸带:

1   #   1   1   #   1   1   1   # …

内态的变化:

q1 q2 q1 q2 q1 q1 q2 q1 q2 q1, …

纸带的变化:

#   0   #   #   1   #   #   #   0 …

可见,现有的“图灵机”(M1)与图灵的“计算机器”(M2)之间存在着微妙的差别:“计算机器”计算完一个实例然后回到初始状态,“不停机”继续计算下一个实例,“无限长的纸带”对应“无限长的可计算序列”(circle-free machine),表达计算机器的计算能力的“通用性”。所以,“计算机器”虽然没有对计算一个实例的时空开销进行规定,但是并非指计算一个实例“不计时空开销”。

而现有的“图灵机”加入了“停机状态”,计算完一个实例就“停机”(接受与拒绝),遂将“无限长的纸带”解读为计算一个实例“不计时空开销”。

六,集合与判断:判断的主体

如上述分析,NP定义的本质是对NP问题的“可计算性”的判断,但是流行的NP定义将“判定问题”等价于“判断问题”,直接得出“NP问题是可计算的”判断。我们从集合与判断的角度,进一步分析其原因。

康托最初给出的集合定义 [14]:

- 集合是“我们感知或思想到的”不同的对象的聚集而成的整体,这些对象称为集合的元素。

- A set is a gathering together into a whole of definite, distincts objects of our perception [Anschauung] or of our thought  - which are called elements of the set.

就是说,集合表达的是对元素与集合的所属关系,即“整体中个体”的“判断”。

判断涉及到“判断的主体”,在一般情况下“主体”指“人”,人运用感知或思想进行判断。当人借助于数学和逻辑进行判断,论域是“数学”;但是人当借助于“算法”来进行判断时,判断的“主体”成了“机器”,论域就从“数学”转移到了“算法”。虽然数学和算法都使用符号,但其组织性质完全不同,数学是纯粹的形式关系,与“物理”无关;而算法则一定是“实时”(Actual Time)过程,与时空有关。

在流行的NP定义中,“判定问题”指“穷举法判定NP问题的给定实例x是否可满足”,判断的主体是“图灵机”(算法),算法与时空有关,然而在现有的可计算性理论中,图灵机的“无限长的纸带”被解释为“不计时空”,“图灵机”因此失去了算法的“物理”性质,实际上成为了“神喻机”,也就是说,判断的主体从“图灵机”偷换成了“神喻机”!所以,“穷举法”判定NP问题的实例与判定NP问题就没有了区别,直接得出“NP问题是可计算的”判断,从而取消了“人”作为判断的主体的“判断问题”,流行NP定义暗含NP=P。

可见,在现有的“可计算性”理论中,存在着判断“主体”的混淆,导致对个体与整体关系认知的混淆,暗中用“个体即整体”替代了“整体中个体”,这正是流行NP定义所隐藏的认知错误的来源,所谓“数学家的误解” [15]。

七,结语

我们追本溯源回到图灵1936年那篇奠基可计算性理论的论文《论可计算数及其在判定问题上的应用》,解读流行的NP定义,质疑“NP问题是穷举法可计算的”流行观点。

通过对比分析,我们指出现有的“可计算性”与图灵的“可计算性”之间有出入。首先,体现在对NP问题的二种表达中:

- 基于“语言”的NP问题;

- 基于“可计算序列”的NP问题。

然后是“图灵机”与图灵定义的“计算机器”之间存在着微妙的差别:

- “图灵机”完成对一个实例的计算而“停机”,“无限长的纸带”被解释为计算一个实例“不计时空开销”;

- 图灵的“计算机器”完成对一个实例的计算后回到初始状态,然后“不停机”继续计算下一个实例。

由此导致关于“可计算问题”的二种观点:

- 现有的“可计算问题是图灵机不计时空开销计算但能停机的问题”,在“物理”上不必是可计算的。

- 图灵的“可计算问题是计算机器能写下可计算序列的问题”,在“理论”和“物理”上的可计算性是一致的。

我们从集合与判断的角度,分析在现有的“可计算性”理论中存在着判断“主体”的混淆,导致“判定问题”与“判断问题”的混淆。我们认为欲解决P vs NP问题,需要正视对NP问题的“可计算性”的“判断问题”,这就意味着需要追本溯源审视对“图灵机”,“可计算性”,“计算复杂性,“停机问题”等计算机理论的基本议题的认识。本文所介绍的工作就是这方面的初步尝试。

我们的工作提示,图灵的著作和工作虽然已经近百年了,尽管在技术实践上取得了巨大的成就,但在图灵的主要理论基础上并没有取得跨越性的进步,甚至已经被作为计算机理论圣经的“图灵机”仍然蒙着一层神秘的面纱,比如问 :

- 为什么现在的“图灵机”与图灵的“计算机器”之间存在着微妙差别?

- 为什么“可计算序列(数)”的概念从现有的计算理论中消失了?

图灵处在世界格局重构的年代,数学和科学理论的大厦己经耸立,工业技术与纯粹理论正在融汇而走向一个全新的信息时代,图灵有幸成为了这个转折点,我们並不期望直接从图灵的论著中找到现成的答案,而是希望通过他的著作去理解他深刻而隐秘的思想,从中获取灵感,用我们的智慧去参与和回应时代面临的挑战,比如P vs NP问题的挑战,。。。

参考文献:

[1] Stephen Cook,  P vs NP Problem (http://www.claymath.org/millennium-problems/p-vs-np-problem)

[2] A Most Profound Math Problem (http://www.newyorker.com/tech/elements/a-most-profound-math-problem),May 2 2013, the New Yorker.

[3] Guest Column: The Third P =? NP Poll William I. Gasarch (https://www.cs.umd.edu/users/gasarch/BLOGPAPERS/pollpaper3.pdf)

[4] William I. Gasarch, The P=?NP poll. SIGACT News Complexity Theory Column 74.http://www.cs.umd.edu/~gasarch/papers/poll2012.pdf

[5] S. Aaronson.  The Scientific Case for P≠NP (https://www.scottaaronson.com/blog/?p=1720)

[6] Turing, A.M. On Computable Numbers, with an Application to the Entscheidungsproblem. Proceedings of the London Mathematical Society, 2 (published 1937), 42 (1), pp. 230–65 (https://www.cs.virginia.edu/~robins/Turing_Paper_1936.pdf)

[7] Stephen Cook, The complexity of theorem proving procedures. Proceedings of the Third Annual ACM Symposium on Theory of Computing. pp. 151-158 (1971). (http://theory.stanford.edu/~trevisan/cs172-07/cook.pdf)

[8]  Garey Michael R., David S. Johnson, Computers and Intractability: A Guide to the Theory of NP-Completeness. W. H. Freeman and company (1979) 

[9] Michael Sipser. Introduction to the Theory of Computation, Second Edition. International Edition (2006) 

[10]  JianMing Zhou, Yu Li, Inquiry of P-reduction in Cook’s 1971 Paper -from Oracle machine to Turing machine. 

http://arxiv.org/abs/1905.06311 

[11] Christos H. Papadimitriou. Computational Complexity. Addison-Wesley Edition (1994). 

[12]  Charles Petzold, The Annotated Turing: A Guided Tour Through Alan Turing’s Historic Paper on Computability and the Turing Machine. John Wiley & Sons, Inc. (2008). 

[13] Hilbert's tenth problem (https://en.wikipedia.org/wiki/Hilbert%27s_tenth_problem)

[14] https://en.wikipedia.org/wiki/Set_(mathematics)

[15] David Deutsch, Constructor Theory David Deutsch. https://arxiv.org/pdf/1210.7439.pdf

未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)云脑研究计划,构建互联网(城市)云脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。

  如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/485094.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

GPT-3和AlphaFold 2震撼2020,2021年AI最大看点在哪儿?

来源:机器学习研究组订阅2020年并不缺重磅新闻,但人工智能依然够杀出重围,走进主流视野。尤其是GPT-3,它展示了人工智能即将以全新的方式深入我们的日常生活。这些进步赋予了未来很多可能,预测未来变得并不容易&#x…

宇宙与无限之谜

文:Alan Lightman译:Sue校对:Rachel在博尔赫斯(Jorge Luis Borges)的《沙之书》(The Book of Sand)中,一个神秘的传教者敲开了故事主人公的门,想要卖给他一本圣书。这本书…

微软、IBM们的中国研究院是怎样一步步“躺平”的?

来源: 脑极体IBM中国研究院关闭的消息,又让大家想起了曾经甲骨文、微软、Adobe等外企研究机构离华的新闻。从上世纪末本世纪初来华,十多年情缘突然宣告分手,固然是遗憾的,也更令人好奇背后的原因。公司业绩表现不佳、研…

斯坦福 AI 课程 10 年发展史

作者:Rachel Oh 、Peter Maldonado转自:机器之心编辑:杜伟、小舟在人工智能领域,斯坦福大学的很多课程都颇受欢迎,如 CS 224N 深度学习自然语言处理和 CS 229 机器学习。这些课程如何一步步发展成为今天的热门课程&…

6G技术长啥样?5大趋势,13个核心技术2030年落地

来源:智东西5G已经展开了全面商用,随着5G在垂直行业的不断渗透,人们对于6G的设想也逐步提上日程。面向2030, 6G将在5G基础上全面支持整个世界的数字化,并结合人工智能等技术的发展,实现智慧的泛在可取、全面赋能万事万…

微积分的未来:DNA、非线性、混沌、复杂系统与人工智能

导语微积分是人类历史上的伟大思想成就之一,也是数学领域不可或缺的一个重要分支。如果没有微积分,人类就不可能发明电视、微波炉、移动电话、GPS、激光视力矫正手术、孕妇超声检查,也不可能发现冥王星、破解人类基因组、治疗艾滋病&#xff…

美国防部官员讨论量子科学、5G和定向能的发展

来源:国防科技要闻3月8日,美国防部国防研究与工程办公室负责现代化建设的三名官员在国防工业协会太平洋作战科技虚拟会议上讨论了量子科学、5G和定向能的发展。量子科学量子科学主要负责人保罗洛帕塔表示,国防部在过去的二三十年里一直在进行…

9-18 学习如何使用Python包的管理

前提是安装好Anaconda 1.如何安装一个包 这里的语句 package_name为包的名字 例如 你可以在cmd窗口下输入 按下回车后 系统将会进行安装numpy包。 你也可以同时安装多个包,比如同时安装numpy、scipy、pandas包。 命令如下 注:numpy:是Python的…

AR行业发展现状:定义、技术原理及商业价值

文章来源:AR工业应用资料源自网络《Pokemon Go》这款游戏能够大火,除了一个好的IP之外。AR技术也功不可没。而在AR发光之后,什么是AR?它的技术原理是怎么样的,它能够具备哪些商业价值?希望通过这篇文章&…

基础学科如何不再“又难又穷”

来源:光明日报投身基础学科意味着什么——“奉献”“冷板凳”“异常艰苦”……也许,这是横亘在数十年间,大学生选报志愿时对“基础学科”的“刻板印象”。在知乎、豆瓣等大学生汇集的社交网站上,谈到基础学科,一位叫刘…

2021年阿贝尔奖公布!理论计算机科学和离散数学领域学者获奖

来源:前瞻网3月17日,2021年阿贝尔奖揭晓。挪威科学和文学院决定将2021年阿贝尔奖授予来自匈牙利,布达佩斯罗兰大学的Lszl Lovsz 和来自美国,普林斯顿高等研究院的 Avi Wigderson,以表彰两位科学家在理论计算机科学和离…

path环境变量丢失恢复

path环境变量不小心丢失,查询到的恢复方法记录一下 WindowsR键,打开:regedit后点击确定按钮 依次按照这个步骤找到path,鼠标右键修改,复制值到path环境变量中就可以了 转载于:https://www.cnblogs.com/liangcl/p/96797…

GPU深度报告,三大巨头,十四个国内玩家一文看懂【物联网智商精选】

来源: 智东西编辑:智东西内参关于GPU,你想知道的都在这里了。GPU是Graphics Processing Unit(图形处理器)的简称,它是一种专门在个人电脑、工作站、游戏机和一些移动设备(如平板电脑、智能手机等&#xff0…

MYSQL--一条SQL查询语句是如何执行的?

select * from user where id10 当输入这条查询语句之后会发生什么? MYSQL逻辑架构图 MYSQL大致可以分为两大部分:Server层和存储引擎层 下面来介绍各层中各部分的作用: 连接器: 客户端请求建立连接,在完成TCP连接…

人工智能功能级别与框架|《远望译品》

来源:远望智库预见未来人工智能功能级别与框架本文摘自《人工智能算法、作战环境及未来趋势预判》|《远望译品》1、人工智能功能级别人工智能不仅在知识域中运行,而且在不同级别上与其他理性个体及其问题空间相互作用。人们对人工智能的期望过…

指针和数组替换和区别

指针和数组替换和区别 指针和数组在很多方面都可以替换 为什么不直接用while(*str ! \0)涉及到了Lvalue和Rvalue的问题 // http://www.dotcpp.com/wp/692.html 例如有字符数组char a[100];当a做右值时候,我们可以把它赋给char *类型的指针,用来指向这个…

C盘扩展卷是灰色的扩容方法

当想要扩容C盘的时候可能会发现C盘的扩展卷竟然是灰色的。原因是C盘旁边没有紧挨着的“”未分配空间“”, 只要将D盘的空间分出一些来就可以了。 !!!磁盘的分区合并有风险,重要文件等记得先备份 !&#xf…

数据与分析领域的十大技术趋势

来源:人工智能与大数据近日,Gartner发布了数据与分析领域的十大技术趋势,为数据和分析领导者的新冠疫情(COVID-19)响应和恢复工作提供指导,并为疫情后的重启做好准备。数据和分析领导者如果希望在疫情后能持…

到达一个数 Reach a Number

2018-09-24 14:19:58 问题描述: 问题求解: 初看到这个问题,直觉上认为可以通过BFS遍历解空间进行求解,因为本质上来说,这个问题和棋盘上移动马的问题是一类问题,都是可以转化成图的问题,但是MLE…

解决AI大难题:如何降低AI运行对能源的消耗?

来源:The Next Web作者:Jeannie Finks编译:科技行者就当下来看,AI领域实现突破性进展的深度学习模型,其规模越大,能耗和成本也随之增加。自然语言处理模型GPT-3就是个典型的例子,为了能够在准确…