来源:混沌巡洋舰
Alphago代表的深度网络人工智能体现了AI逐步进入未知领域的强大能力, 因此有人堪忧有人喜乐, 却极少有人戳中要害。说AI比人牛是因为它下围棋比人厉害? 说AI离真正的智能很遥远是因为它不能创造吗? 是因为它只擅长形式逻辑? 是因为它没有自我意识? 而深度网络代表的这波人工智能风潮代表的是一种局部的演进,还是未来的一扇大门打开?
网络上各种似是而非的谣言其实了表现了我们连生物的智能都不了解。 我们回顾一下神经科学和AI的历史, 从脑和智能的演进来看这个所谓的人工智能有多聪明。
要谈这个问题,我们就需要从智能说起, 智能其实分为三个层次,对应丹内特对意识进化的三个分级: 达尔文式造物 ,斯金纳式造物, 波普尔式造物 。
智能的第一个层次是进化(达尔文式),而不是自我意识这些高端装逼的东西。智能的起点是学习,学习即对环境变化做出相应对策。 整个生物进化过程,就是学习的过程。为什么呢? 你一个小小的细菌, 也可以对环境做出趋利避害的反应, 并且通过基因突变的方法有点盲目的适应环境,这其实就是用遍历法来选择针环境变化的最佳生存策略,然后通过遗传以及下一代继续试错,将某种策略强化。
阿法狗的策略网络也是类似的道理, 通过对可选策略集合的分析进行局部最优的调整。 细菌和十亿年的 的恶略环境下棋, 把对哪些化学物质该如何转化这个信息深深的埋藏在了它的DNA里, 因此才可以有如今如此从极地到大漠的如此伟大的适应性。 大自然的这种学习方式可以看做智能1.0版, 缺陷是速度慢和读取数据量小 。我们人类模仿进化的过程创造了进化选择算法, 作为人工智能一个非常基础的部分。
智能1.0 版 进化算法 - 遍历所有可能并加以选择,最终得到最适合环境的策略,被动但是在历史长河里极为有效 。
达尔文智能主宰了漫长的生物进化史的大部分岁月, 使得单细胞生物逐步具有越来越复杂的性能。
阿尔法狗的策略网络(蒙特卡洛树搜索)-- 细菌级别的智慧, 20年前的深蓝却使用它打败了人类国际象棋大师。
下面我想说的是第二阶段的智能, 斯金纳(伟大的行为心理学家)式造物。 斯金纳式造物说的是生物自己能够自主的去学习而非被动的靠基因变异适应环境。 这项伟大的创举背后就是大名鼎鼎的神经网络, 生物进化几十亿年的历史都是这种被动的适应环境, 直到神经网络的出现一切才悄悄发生变化。
神经网络的作用简单来看, 就是一个分类器, 它可以把外界刺激分成好的和坏的, 并且趋利避害。拥有这个分类器, 动物终于可以在自然环境面前主动做决策, 并且趋利避害。把狮子放在要躲避的那一堆, 异性放在要接近的那一堆对于动物的生存意义之重大不言而喻。 这个分类器最开始是储存一些先天的条件反射, 比如婴儿见到目前的乳头就要吸。 而后来就出现了后天习得的条件反射, 比如著名的巴甫洛夫的狗,听到铃声就会分泌口水。没错, 后天形成的条件反射-就是学习的2.0版。
然而生物神经网络是如何实现这一调整的,却一直是个迷,直到1940年Hebb提出神经科学的牛顿定律-Hebbian learning rule, 人们开始了解神经网络是如何实现这一步骤。Hebb说组成神经网络的神经元通过不停的调整之间的突触连接来改变对外界刺激的反应,这个变化法则就是同时放电的神经元连接加强(细节来看还与放电的顺序有关)。 这就使得被一起激活的神经元形成一个基团, 比如狗听到铃声以后被喂食, 那铃声这个刺激之前狗可能没有任何反应,而之后就被划分到午餐那一类, 从而形成对铃声的条件反射。
阿尔法狗深度学习的基本原件人工神经网络也是一个人为敲定的分类器, 用于做决策。人工神经网络的训练过程同样借鉴了生物神经网络的学习过程, 根据反馈调整神经元之间连接的权重关系, 来实现对外界信号分类方法的改变, 因此调整决策(reinforcement learning 强化学习)。
生物形成新的条件反射,可以理解为一个决策的生成, 用二进制表述后成为分类问题。
分类问题可以由神经网络解决:
上图的神经网络, 就是一个基本的卷积网络, 把输入的值乘以一定权重在加在一起, 再通过一个非线性的阶梯函数, 转化为0(有害),1(有利)的输出, 即决策过程。
学习, 数学上叫调参: 改变w的数值即可改变分类的方法(界限)。
训练的过程, 图中为一个分类野生和家养动物的网络,随着数据量的加大分类越来越准确。
神经网络的分类功能, 把输入的信息(环境变化)分为有利和有害的进行决策, 环境的变化越复杂, 越体现神经网络可以任意的通过改变连接强度来调整决策“界面” 的优势, 而不需要用进化的方法上下一辈来适应环境(学习的重要性)。当然这个学习过程需要大量数据的训练。
结论: 一个单层神经网络完全可以娴熟的应用斯金纳造物 从第二种智能方式我们依然可以看到, 生物智能的方式是如何启发了人工智能。
波普尔造物, 对外部世界进行表征, 形成认知,信念和预期,则对应神经网络的更高级功能。 如果仔细思考, 我们会发现这些很多包含在阿法狗使用的深度网络里。 首先, 深度网络最擅长的是对事物进行抽象(深度学习), 在最靠近输入的层次上, 每个细胞就如同数码相机CCD上的像素,之后的每一层次都比上级网络的感受野要大, 而最终得到的效果是最深层的神经元直接处理和图像的全貌相关的特征,比如照片上的人是谁。如果换到其他地方,就是从抽象或全局特征进行决策。
这个结构像极人类社会的结构, 越是高层, 越能把握和总控全局。深度网络上的“抽象概念”这个认知武器,使得阿尔法狗有对全盘棋的趋势进行判断的能力,可以迅速舍弃一些错误的方向,减少搜索的深度,即价值网络。 其实人脑所使用的算法和阿尔法狗差距没有那么大, 记得前些年有一篇著名的science文章说人类发现在高级脑区表现抽象概念-如人名的细胞,这是符合这种深度网络逐层抽象的概念。高级脑区正是对应人脑深层网络的最底层。
阿尔法狗此次能够战胜代表棋牌巅峰智慧的围棋冠军这件事最大的意义,也在于深度网络赋予了AI自主判断局势和形成策略,而不是靠之前的仅靠人为给定的策略遍历所有可能。或者说深度网络打开了波普尔造物的大门
当然,深度网络算法只是提取了生物神经网络的一个主要特征 , 而几亿年进化结晶的人脑, 由于计算机能够提取并用于学习的数据量巨大, 使得它能够在学习了人脑的一个雕虫小技之后通过迭代学习迅速在某个特定任务上超越人类。
波普尔式的智能-深度网络
就上面这个简单的历史陈述我们发现,AI说到底是一种仿生,但是这种仿生无疑会改变我们生活的方方面面, 目前网络对于阿法狗的大多数评论或者夸张或者贬低了ai的价值和深度,不仅是对AI的理解不清, 更是对我们自身的理解不清。
阿尔法狗的智慧是结合了古老的细菌智慧(策略网络)+高级哺乳动物的智慧(价值网络),可谓仿生物智慧杰作
然而根据《丹尼尔丹内特讲心智》一书,还有更高级的格里高利式造物,其强调工具的重要性,通过利用他者发明、改进与传播的心智工具里所体现的智慧,从他者的经验中受益。格里高利式造物向着人类心智的机敏程度迈出了一大步。它们学会了如何更好地思考下一步应该想些什么等,从而产生了一座没有固定或清晰界限、更加深入内部的反思塔。
它们学会了如何更好地思考下一步应该想些什么等,从而产生了一座没有固定或清晰界限、更加深入内部的反思塔。
一些常见问题:
1. AI到取代人类大量劳动的时候了
AI一定会逐步取代简单的人类劳动, 但是也会增加新的劳动出来, 比如AI设计, AI纠错 , 以及如何利用AI做出以往实践不能的事, AI将使得人脑从简单劳动中解放, 可以爆发中不可预计的新产业。
2, AI没有意识, 无法预测,没有创造力, AI几乎永远无法与人类智能望其相背。
人类容易犯的错误之一, 就是用一些自己也无法严格定义的概念去套用机器。 “ 意识” “ 创造力”这些概念, 其实人类自身也不理解, 你站在人类的角度上, 去讨论ai有无意识这个问题, 是自己陷入了一个思维的陷阱。因为究其根本, 我们对自己有没有意识这件事也没有一个掌控的时候, 整个这样的讨论流于空泛。 而对于这些概念的进一步掌握, 取决于神经科学的进步。虽然我比较怀疑很快强人工智能会出现, 但是即使出现, 它也不一定需要以我们人类能理解的方式产生意识, 达到目标。说不定在另一个外星观测者看来, 我们也是无意识的, 意识不过是这个被称作“人”的东西所使用的多级神经网络里某个调节参数的辅助工具。
3, 觉得AI的运转方式一定和人脑是天壤之别的
这也是犯了太骄傲的毛病。因为你并不懂得人脑运算所采用的算法。 人脑这个东西, 即使是情感这些我们觉得很柔软的功能,背后也是以海量运算为背景的,而目前的科学论文证实的是, 在视皮层的运算, 很多与目前的深度网路运算是很接近的。有的人说人是向前看的动物而机器只会向后看, 事实上呢, 人对未来的预测也来自于对过去数据的大量积累。
我们并无太多证据受AI是否和我们的大脑有着相类似的运转方式, 但是有一点肯定的是, AI的发展源自我们对自身的模仿, 而对AI的探究反过来正在帮助我们理解我们自身 ,这也是生命最终的意义。正如费曼所说, 只有你知道如何制造一个东西, 你才真正理解它。
未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)大脑研究计划,构建互联网(城市)大脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。每日推荐范围未来科技发展趋势的学习型文章。目前线上平台已收藏上千篇精华前沿科技文章和报告。
如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”