加利福尼亚大学提出从「因果革命」的七大成就中为「机器学习」寻求良好的模型指导

原文来源:arxiv

作者:Judea Pearl

「雷克世界」编译:嗯~是阿童木呀


可以这样说,目前的机器学习系统几乎完全是以统计模式或无模型模式运行的,这对于其功率和性能来说存在着严格的理论限制。这样的系统不能引发干预和反思,因此不能作为强人工智能的基础。为了达到人类的智力水平,学习机器需要一个现实模型的指导,就类似于在因果推理任务中所使用的模型。为了演示这些模型的基本作用,在本文中,我将对当前机器学习系统所无法实现的7项任务作一个总结,而且这些任务是使用因果建模工具完成的。


科学背景


如果我们检查如今驱动机器学习的信息是什么,我们会发现它几乎完全是统计信息。换句话说,学习机器通过优化来自环境的感官输入流上的参数来改善其性能。这是一个缓慢的过程,在很多方面类似于推动达尔文进化论观点的自然选择过程。它解释了老鹰和蛇这样的物种是如何在数百万年的时间里进化为具有高超的视觉系统的。然而,它并不能解释为什么人类在仅仅一千年的时间里就能制造出眼镜和望远镜这样的超级进化过程。人类所拥有的其他物种所缺乏的是一种心理表征,一种他们可以操纵的环境蓝图,从而他们可以想象另一种假想的环境以进行规划和学习。像N. Harari和S. Mithen这样的人类学家普遍认为,在4万年前,我们的智人祖先(Homo sapiens ancestors)之所以具有实现全球统治的能力,决定性因素在于他们具有这样一种能力,对其环境进行心理表征编排、不断问询该表征、通过想象的心理行为扭曲它、最后回答“如果?”类问题。例如介入性问题:“如果我采取行动,会怎么样?”以及反思性或解释性问题:“如果我采取了不同的行动,结果又会怎么样呢?”今天,没有任何一个学习机器可以回答这样的问题,比如“如果我们禁止吸烟,会怎么样?”除此之外,今天的大多数学习机器都不能从这样的问题中提供一些表征,其中,这些问题的答案是可以推导出来的。


我认为,对于阻碍实现加速学习速度和人类水平性能表现的主要障碍来说,应该通过消除这些障碍并为学习机器配备因果推理工具来克服。其实,这个假设在二十年前,在反事实数学化(mathematization of counterfactuals)之前就已经被推测出来了。但今天的情况不一样了。


图形化和结构化模型的进步使反事实在计算上易于管理,从而使得模型驱动推理成为一个更有前途的研究方向,从而建立强人工智能。


下面,我将使用一个三级层次来描述机器学习系统所面临的障碍,这个三级层次管理因果推理中的推理。

 

因果关系的层次结构。只有当i级或更高级的信息可用时,i级的问题才能够被回答


我们从上图可以看出,因果推理的逻辑揭示了一个极其有用的见解,即对因果信息的一个清晰分类,就每个类别能够回答的问题类型而言,这个分类形成了一个三层次的层次结构,这意味着只有当j级(j≥i)的信息可用时, i级(i = 1,2,3)上的问题才能被回答。


因果革命中的七大支柱(或者你只能使用因果模型才能做,不使用便不能做的是什么?)考虑以下五个问题:


  • 在预防疾病方面,一种治疗方法的效果如何?


  • 新的税收减免是否导致我们的销售额增长?


  • 因肥胖引起的年度医疗保健费用是多少?


  • 雇佣记录可以证明雇主有性别歧视吗?


  • 我即将辞职,但我应该这样做吗?


这些问题的共同特点是它们关心的是因果关系。我们可以通过诸如“防止”、“原因”、“归因于”、“歧视”和“我应该”这样的字眼来识别它们。这些词是常见的日常用语,以及我们的社会不断地要求对这些问题进行回答。然而,直到现在,科学还是没有办法将其表达出来,更不用说回答它们了。与几何、力学、光学或概率规则不同,因果规则早已被否定了数学分析的好处。


哈佛大学教授Golry King从历史的角度给出了这样一种转变:“在过去的几十年里,人们对于因果推断的了解比以前所有历史记录中所学到的事物总和还要多”(Morgan和Winship于2015年提出)。我把这种转变称为“因果革命”(Pearl和Mackenzie于2018年提出),而对于导致它出现的数学框架,我将其称之为“结构性因果模型(SCM)”。SCM部署了三个部分:


1.图形化模型


2.结构化方程


3.反事实和介入逻辑


图形化模型作为一种语言,用以表达我们对世界的了解,反事实有助于我们阐明我们想知道的东西,而结构化方程则是将这两者结合在一起,形成一个坚实的语义。

 

该图展示了,SCM“推理引擎”是如何将数据与因果模型(或假设)结合起来,以生成对有用查询的答案


接下来,我们将对SCM框架的七项成就进行一个概述,并讨论每个支柱为自动推理艺术带来的独特贡献。


支柱1:对因果假设进行编码 ——透明度和可测试性


一旦我们认真对待透明度和可测试性的要求,用一种紧凑的、可用的形式对假设进行编码的任务并不是一件简单的事情。透明度使分析人员能够辨别所编码的假设是否合理(基于科学依据),或者是否有必要进行额外的假设。可测试性使我们(无论是分析师还是机器)能够确定所编码的假设是否与可用数据兼容,如果不能,则确定那些需要修复的假设。


支柱2:做微积分和对混淆的控制


混淆(confounding),或者是存在于两个或更多变量中未被察觉的原因,长期以来一直被认为是从数据中得出因果推断的主要障碍。这一障碍已经通过一个被称为“后门(back-door)”的图形化标准揭开且被“去混乱(deconfounded)”了。特别地,选择一组适当的协变量来控制混淆的任务已经被简化为一个可以通过简单算法(Pearl,1993)进行管理的“路障”难题。


支柱3:反事实的算法化


反事实分析处理的是特定个体的行为,通过一组不同的特征对其进行确定。例如,考虑到乔的薪水是Y = y,并且他读了X = X年大学,那么,如果他再接受一年的教育,他的薪水会是多少。


支柱4:中介分析与直接和间接影响评估


中介分析(Mediation Analysis)涉及的是一个将变更从原因传递到其影响的机制。这种中间机制的识别对于生成解释是必不可少的,而反事实分析必须被调用以促进这种识别。反事实的图形化表示使得我们能够定义直接和间接的影响,并决定何时这些影响该从数据或实验中进行评估(Robins和Greenland于1992、Pearl于2001年、VanderWeele于2015年提出)。通过这种分析可以回答的典型查询是:X对Y的影响有多少是由变量z来调节的。


支柱5:外部有效性和样本选择偏差


每个实验研究的有效性都受到实验和实施设置之间差异的挑战。在环境条件改变的情况下,在一个环境中进行训练的机器不能期望其能够表现良好,除非这些改变是局部的且是可以确定的。这个问题及其各种表现形式已经得到机器学习研究人员的认可,诸如“领域适应”、“迁移学习”、“终身学习”和“具有可解释性的AI”等企业只是研究人员和资助机构确定的一些子任务,试图缓解鲁棒性的通用问题。不幸的是,鲁棒性问题需要一个环境的因果模型,并且不能在关联级别上进行处理,在这个层面上,大多数的补救措施都被尝试过了。而关联还不足以确定受所发生变化影响的机制。上面讨论的do-calculus提供了一个完整的方法以克服由于环境变化造成的偏见。它既可用于重新调整学习政策,以规避环境变化,也可用于控制非典型样本的偏差(Bareinboim和Pearl于2016年提出)。


支柱6:缺失数据


缺失数据的问题困扰着实验科学的每一个分支。受访者不回答问卷中的每个一项,随着环境条件的变化,传感器会逐渐消失,而患者往往因为不明原因从临床研究中退出。关于这个问题的丰富的文献与统计分析的model-blind模式相吻合,因此,它被严重地限制在随机发生的情况下,也就是说,与模型中其他变量所取的值无关。通过使用缺失过程的因果模型,我们现在可以在把因果关系和概率关系从不完整的数据中恢复的情况下,对条件进行形式化,并且只要条件满足,就可以产生对所需关系的一致估计(Mohan和Pearl于2017年提出)。


支柱7:因果发现


上述的d-分离标准使我们能够检测和列举给定因果模型的可测试含义。这就开启了这样一种可能性,即假设一组与数据兼容的模型,并可以很紧凑地对这个集进行表征。系统搜索已经被开发出来,在某些情况下,可以将一组兼容模型显著地裁剪到可以从该集中直接对因果查询进行估计的程度。


结论


哲学家Stephen Toulmin于1961确定了model-based和model-blind的二分法,认为这是理解巴比伦与希腊科学之间古代竞争的关键。根据Toulmin的说法,巴比伦天文学家是黑盒预测的主人,在准确性和一致性方面远远超过了他们的希腊对手。然而科学青睐希腊天文学家的创造性思辨策略,这些天文学家对形而上学的意象充满了狂热:充满火焰的圆形管、小洞通过神圣的火焰可以看到星星、还有骑在龟背上的半球形地球。然而,这种狂热的建模策略,并不是巴比伦的僵化,而是促使Eratosthenes(公元前276 - 194年)早在古代世界就进行了最有创造性的实验之一,并测量了地球的半径。这在巴比伦的曲线钳工身上是绝对不会发生的。


回到强人工智能上,我们已经看到model-blind的方法对它们可以执行的认知任务的内在局限性。我们描述了其中的一些任务,并展示了如何在SCM框架中完成这些任务,以及为什么基于模型的方法对于执行这些任务是必不可少的。我们的总体结论是人类水平的AI不能单纯地从model-blind的学习机器中出现,它需要数据和模型的共生协作。


数据科学只不过是一门科学,它有助于对数据进行解释——一个两体问题,将数据与现实联系起来。而不管数据有多大,以及它们被操纵得多么巧妙,数据本身并不是一门科学。


未来智能实验室是人工智能学家与科学院相关机构联合成立的人工智能,互联网和脑科学交叉研究机构。由互联网进化论作者,计算机博士刘锋与中国科学院虚拟经济与数据科学研究中心石勇、刘颖教授创建。


未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)云脑研究计划,构建互联网(城市)云脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。

  如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/497528.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

被讨厌的勇气--总结

思维导图:https://www.processon.com/view/link/60d6fc2c7d9c087f54753b90

创建一个动物类 java_使用java面向对象创建动物类并输出动物信息

题目:使用java面向对象创建动物类并输出动物信息gitup下载地址:https://github.com/benxiaohai8888/Javase/blob/master/Animal.java代码:import java.util.Scanner;public class Animal{private double weight;//体重private int leg;//腿的…

java执行字节码的语句_Java字节码指令

Java虚拟机的指令由一个字节长度的、代表着某种特定操作含义的数字(操作码,Opcode)以及跟随其后的零至多个代表此操作所需的参数(操作数,Operands)构成。即:Java指令 操作码 操作数。由于Java虚拟机采用面向操作数栈而不是寄存器的架构&…

3分钟了解今日头条推荐算法原理(附视频+PPT)

来源:大数据文摘概要:2018年1月,今日头条资深算法架构师曹欢欢博士,终于首次公开今日头条的算法原理,以期推动整个行业问诊算法、建言算法,希望消除各界对算法的误解。今日头条的内容分发算法一直颇神秘低调…

高效休息法--总结

思维导图:https://www.processon.com/view/link/60d6fcaf1e08532a43bea653

执行-技术人的管理之路--总结

思维导图:https://www.processon.com/view/link/5f0a6983e401fd0c8fffa75b

java进度条动画_Android自定义控件之圆形进度条动画

本文实例为大家分享了Android实现圆形进度条动画的具体代码,供大家参考,具体内容如下首先贴上图片:额,感觉还行吧,就是进度条的颜色丑了点,不过咱是程序员,不是美工,配色这种问题当然…

人脸识别必读的N篇文章

来源:机器视觉概要:人脸检测/跟踪的目的是在图像/视频中找到各个人脸所在的位置和大小;对于跟踪而言,还需要确定帧间不同人脸间的对应关系。一 、人脸检测/跟踪人脸检测/跟踪的目的是在图像/视频中找到各个人脸所在的位置和大小&a…

所谓高情商就是会说话--总结

思维导图:https://www.processon.com/view/link/60d6fe741e08532a43bea811

美国12大科技公司如何参与自动驾驶?

来源:腾讯科技概要:无人驾驶汽车的潜力已经逐步显现,这一点,从本周在拉斯维加斯举行的国际消费电子展(CES)就可以看出端倪。无人驾驶汽车的潜力已经逐步显现,这一点,从本周在拉斯维加…

java web响应式框架_Web开发的十佳HTML5响应式框架

HTML5框架是一类有助于快速轻松创建响应式网站的程序包。这些HTML5框架有着能减轻编程任务和重复代码负担的神奇功能。关于HTML5的框架种类繁多,并且很瘦欢迎,因为它能允许开发人员花费更少的时间和精力去创建一个令人惊艳的网站。在本文中,我…

开放-封闭原则(OCP)

开放-封闭原则(The Open-Close Principle) 软件实体(类、模块、函数等)应该是可以扩展的,但是不可以修改的。 两个特征 1、对于扩展是开放的(Open for extension); 2、对于更改是…

风向2018 | AI 突围

来源:36氪概要:回到战场,考验各家公司CEO和谋士的时刻,已经到来。问:2017年AI行业最大的进展是什么?答:创业公司的估值。高估值,曾将AI初创公司带上高光的创投舞台,也正将…

php return 值_php return的用法是什么

php return的用法:1、通过“return expression”语法返回一个表达式结果;2、使用“return(expr)”语法返回函数表达式;3、直接使用return返回值即可。本文操作环境:Windows7系统、PHP7.1、Dell G3电脑。基本用法:a)、r…

谷歌放出AI平民化大招: 李飞飞宣布推出AutoML云平台,让普通企业也能用上深度学习

作者:杨晓凡概要:谷歌云机器学习平台(Google Cloud AI)自从上线以来就以预训练的、可以直接调用的高效机器学习模型吸引了许多企业级用户在其上构建简单的机器学习应用。谷歌云机器学习平台(Google Cloud AI&#xff0…

AI博弈论:DeepMind让智能体在非对称博弈中找纳什均衡

Root 林鳞 编译自 DeepMind官方博客量子位 出品 | 公众号 QbitAI随着人工智能系统在现实世界中扮演越来越重要的角色,理解不同的系统如何相互作用至关重要。刚刚,DeepMind发表了一篇名为Symmetric Decomposition of Asymmetric Games的论文。在这篇论文中…

php ie 下载 乱码,php ie下载文件名乱码怎么办

php ie下载文件名乱码的解决办法:1、通过header方法解决乱码;2、通过“function remote_filesize($uri,$user,$pw) {...}”等方法解决乱码。php文件下载IE文件名乱码问题一直用chrome浏览器,没发现问题。今天用ie6,发现文件下载时…

无人驾驶技术排名:百度居中游,苹果特斯拉垫底 | 行业

来源:网易科技概要:其调查研究显示,无人驾驶汽车行业的现状已经发生了天翻地覆的变化,而特斯拉、苹果公司在今年的排名垫底。1月17日消息,据CNET网站报道,日前,美国市场研究机构Navigant Resear…

h5 换脸 php,【部分原创】python实现视频内的face swap(换脸)

1.准备工作,按博主的环境为准Python 3.5Opencv 3Tensorflow 1.3.1Keras 2cudnn和CUDA,如果你的GPU足够厉害并且支持的话,可以选择安装那就先安装起来,有兴趣的朋友给我个暗示,好让我有动力写下去,想实现整套…

接口隔离原则(ISP)

接口隔离原则(The Interface Segregation Interface) 这个原则用来处理“胖(fat)”接口(类的接口不是内聚的)所具有的缺点。“胖”接口可以分解成多组方法。 考虑一个安全系统,有一些Door对象&a…