寻找可落地的因果科学范式:从因果推理到因果学习

6d893e05c5a3457b7ca8babc2028654b.jpeg

来源:集智俱乐部

作者:丁善一 

编辑:邓一雪

导语

目前在互联网的交互框架内,用户和消费者只被允许做“有限的表达”,比如被设计好的制式问题、按钮、案件、关键词命中等等,从而臆测主观诉求,然后希望可以用“猜你喜欢”的方式留住用户。如何在业务中允许用户或消费者做开放式的表达,并能够有能力结合服务者和商品进行因果表征,对因果图进行扩充,进而规模化地去应对这种开放式的表达,是当前智能服务领域面临的挑战之一。

7月2日,由零犀科技与集智俱乐部共同打造,旨在加速人工智能学界和产业界在因果科学领域融合探索的“因果派”论坛成功召开。重庆大学教授、博士生导师刘礼教授围绕栩栩如生的例子介绍了人工智能的进展、与大数据的关系以及目前存在的问题,对如何更好的从因果的角度理解和解决实践应用中出现的问题尝试进行解答。

1. “浅入深出”介绍因果

辛普森悖论有一个典型的例子,实验者观察肾病患者的服药情况,发现分男女组别考察,服药男性和女性的治愈率都分别高于不服药的患者,从而能够得出”服药有助于恢复”的结论。但从整体样本考察,会发现不服药的治愈率83%高于服药的治愈率78%。

77c701507671328fa1bd00939a848247.jpeg

图1 辛普森悖论

另外一个辛普森悖论的例子关于房价。对比某城市10年前和现在的房价,市中心和高新区的房价分别都涨了。但从整体上看,现在的房价反而跌了。

辛普森悖论虽然不是新提出的,但却是各领域不可忽视“顽疾”。在上个世纪90年代,人工智能方法大多是专家系统,它是基于逻辑、符号或人类知识规则的一套推理方法。在2017年Alpha Go打败人类之后,人工智能的方法则几乎完全倒向了基于数据驱动的机器学习方法,并且迎来了更广泛的应用,比如语音识别、翻译和人脸识别等。在很多场景下会有比较明显的效果,但同时面临着产品实现的效果严重依赖于数据的数量和质量的问题。

这种分组和整体结论不同的情况,也是机器学习模型的困境。例如训练数据和测试数据不满足独立同分布假设(Independent and Identically Distributed, I.I.D),那么机器学习在分布偏移情况下很难鲁棒地学习,在新的场景中很难使用现有的模型。

为了进一步理解,I.I.D.带来的问题,让我们考虑下面的例子。Alice想在网上买一个笔记本电脑包,网上商店的推荐系统于是向Alice推荐了笔记本电脑。这个推荐看起来很不合理,因为很可能Alice是已经买了电脑才去买包。假设该网站推荐系统使用统计模型仅仅基于统计相关性来推荐,那么我们已知事件“Alice买了包”对于事件“Alice是否会买电脑”的不确定性减少,和已知事件“Alice买了电脑”对于事件“Alice是否会买包”的不确定性减少是相等的,都为两个随机事件的互信息。这就导致我们丢失了重要的方向信息,即买电脑往往导致买包。

1808bfa4b8618755fb8cb1aebe878dc7.jpeg

图2 因果关系vs相关关系

实际上,目前基于数据驱动的机器学习方法训练出的模型所得出的结论,大多是变量和变量之间的相关关系而不是因果关系。例如,之前有项研究发现在某大国暴力犯罪与腌黄瓜消耗密切相关。也有人发现,牛奶喝得越多的国家,其获诺贝尔奖的数量就越多。甚至还有人发现,尼古拉斯·凯奇每年演的电影数量和每年美国溺亡人数的曲线吻合。但以上的种种相关性并不代表因果性。

e5f296c3213e848da0f9f36ea1bf88f7.jpeg

图3 混淆变量

从因果的角度,辨析以上所述的几个问题需要考虑混淆变量。混淆变量会同时影响独立变量和因果变量,从而造成两者之间的伪相关。如果将传统统计和因果推断进行对比,有以下几个特点:

897f47eae6aaabbf7d19450d27b7491e.jpeg

图4 传统统计和因果推断

深入思考,其实西方科学的发展史就是因果问题,这套真理体系、推理体系我们从小就在学习:已知1+1=2,1+2=3,可以推导得出1+1+1=3。当然,这套体系也有可能出错,例如牛顿定律在地球上适用,但在宇宙中就失效,从而爱因斯坦提出了相对论。所以存在因果性,则一定存在相关性,但反之不一定成立。

2. 数据驱动迈向可解释性

主流数据驱动的机器学习已经非常成功,无论是阿法狗,还是GPT都带来了惊艳的效果。但有两个缺点:没有可解释性、可控性差。

cb2982f0ca3b353758e26b4fa42a12fa.jpeg

图5 因果关系之梯

为了解决上述问题,图灵奖获得者朱迪亚·珀尔提出因果关系之梯。如上图,第一层次是关联,通过概率表达描述出观察到的一堆数据。第二层次是干预,不仅是观察,而且是进行实验改变,例如如果吃了阿司匹林,我的头痛会得到治愈吗?如果我们禁止吸烟将会发生什么?其中,吃药和禁止吸烟都是干预手段。第三层次是反事实,在既定结果已经发生的情况,假设当初采取另一方案,则会发生什么。反事实不会得到观察数据,毕竟不存在两个平行世界,但确实经常遇到的情况,经典的就是人们常说的“如若当初........就不会......”。

20bac6478e94c0e4ed5d822d452b34e6.jpeg

图6 反事实问题

反事实问题目前非常难解决,也有很多例子。黑人被警察控制事件,反事实下,就对应:如若白人被警察控制了,会发生什么?在影视剧中,也常发出如若是另外某个明星参演,票房会有什么变化。这些反事实问题没办法验证,但需要回答。

e47bf954cbd6e6a1c9f9b254ce3f24c8.jpeg

图7 两套因果模型

针对此问题,目前有两套主要的因果模型:珀尔的结构因果模型;罗宾的潜在结果模型。两者都可以预测、干预以及回答反事实问题,对于“发现定理知识”目前还不确定是否可行。潜在结果模型可以从数据中学习,但与现有知识相结合比较困难。而结构因果模型则相反,可以结合现有知识,但从数据中学习的能力还亟待进一步检验。在工业界当中哪一套体系更好,需要具体问题具体分析,和进一步的探讨。

目前,因果范式有几个问题正在解决:因果发现、因果推理。

因果发现需要基于已有的数据找出变量和变量之间的因果关系。除了基于约束和基于评分规则的方法之外,还有因果表征。

表征学习是机器学习中的重要问题,联合好的表征是机器学习算法成功的重要条件,因为统计学习模型需要I.I.D.假设,若测试数据与训练数据来自不同的分布,统计学习模型往往会出错。然而在很多情况下,I.I.D.的假设是不成立的,而因果推断所研究的正是这样的情形:如何学习一个可以在不同分布下工作、蕴含因果机制的因果模型(Causal Model),并使用因果模型进行干预或反事实推断。

在因果推理层面,珀尔提出了Do算子,在因果图上给出了一系列定理和假设,用传统的概率表达形式进行操作,这就让“因果”变得可计算。除此之外,还有反事实计算框架、因果效应评估等等。

3. 因果框架符合现实假设

在将因果理论落地的工作中,在可控图像生成方面,目前的图像自动生成很多都是以条件为主的,例如给定标签的控制、图像的控制、文字的控制。与当前基于条件的生成方法不同,我们研究出三种类型的方法:基于已有观察数据、基于潜在变量数据、基于因果干预变量数据。其中,因果干预图像合成方法是对相应的变量进行解耦,观察变量变化如何导致结果变化,从而精准控制图像的某一部分合成。

202cc729e07a73a8355a3b20166c083a.jpeg

图8 基于结构函数的因果模型

此外,因果方法在医疗领域有很多应用。特别在疾病归因分析与预测方面,我们基于结构函数的因果模型设计了因果发现框架,通过超越分子与分子之间的关联性来发现其因果性。具体操作分成两步:第一步发现变量和变量之间,包括潜变量之间的因果图;第二步基于因果图,确定明确的结构函数关系。

在最具代表性的肿瘤特征选择课题上,我们还开发出基于贝叶斯图学习因果模型,超越了传统学习函数步骤,使用因果图进行描述关系。

在人体行为识别方面,我们还认为当前的识别手段多是采用传感器和视频流的方式进行,会有前后的因果关系。因此,可以用格兰杰因果方法解决时序因果中的问题。

因果学习作为人工智能领域研究热点之一,它更注重支持干预、规划、推理的模型,其研究进展与成果也引发了众多关注,将因果与深度学习结合很可能是通往多用途AI的必经之路。

未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)大脑研究计划,构建互联网(城市)大脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。每日推荐范围未来科技发展趋势的学习型文章。目前线上平台已收藏上千篇精华前沿科技文章和报告。

  如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”

af2afa3c6e660ae224f8946f7a47c289.jpeg

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/481813.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

液体火箭发动机技术国家级重点实验室2021年度对外开放项目指南

液体火箭发动机技术国家级重点实验室2021年度对外开放项目指南 人工智能技术与咨询 国家级重点实验室 简介 西安航天动力研究所液体火箭发动机技术国家级重点实验室瞄准面向航天运输系统对液体火箭发动机技术的需求,重点开展基础性、创新性和重大关键技术的预先研…

迈向可验证的 AI: 形式化方法的五大挑战

来源:前沿科技作者:Sanjit A. Seshia, Dorsa Sadigh, S. Shankar Sastry编译:李梅、黄楠编辑:陈彩娴人工智能试图模仿人类智能的计算系统,包括人类一些与智能具有直观联系的功能,例如学习、解决问题以及理性…

数字孪生及其在航空航天中的应用

数字孪生及其在航空航天中的应用 人工智能技术与咨询 来源:《航空学报》,作者孟松鹤等 摘要: 数字孪生已引起国内外的广泛重视,可看作是连接物理世界和数字世界的纽带。其通过建立物理系统的数字模型、实时监测系统状态并驱动模型动态更新实…

【综述专栏】马毅沈向洋曹颖最新AI综述火了!

来源:量子位在科学研究中,从方法论上来讲,都应“先见森林,再见树木”。当前,人工智能学术研究方兴未艾,技术迅猛发展,可谓万木争荣,日新月异。对于AI从业者来说,在广袤的…

水声被动定位中的机器学习方法研究进展综述

水声被动定位中的机器学习方法研究进展综述 人工智能技术与咨询 来源:《信号处理》,作者牛海强等 摘 要: 本文对基于机器学习方法的水声被动定位研究进展进行了综述。所涉及的机器学习方法有多层感知机(前馈神经网络)、支持向量机、随机森…

不盲追大模型与堆算力!沈向洋、曹颖与马毅提出理解 AI 的两个基本原理:简约性与自一致性...

来源:AI科技评论论文作者:马毅、曹颖、沈向洋整理:西西编辑:陈彩娴近两年,“大力(算力)出奇迹”的大模型成为人工智能领域多数研究者的追求趋势。然而,其背后巨大的计算成本与资源耗…

微服务技术发展的现状与展望

微服务技术发展的现状与展望 人工智能技术与咨询 来源:计算机研究与发展,作者冯志勇等 摘 要 随着云计算、物联网等技术迅速发展,用户对软件系统的需求趋于多样化,面向服务的体系架构(service oriented architecture, SOA)需要…

规则引导的知识图谱联合嵌入方法

规则引导的知识图谱联合嵌入方法 人工智能技术与咨询 本文来自《计算机研究与发展》 ,作者姚思雨等 摘 要 近年来,大量研究工作致力于知识图谱的嵌入学习,旨在将知识图谱中的实体与关系映射到低维连续的向量空间中.且所学习到的嵌入表示已…

潘云鹤院士获吴文俊人工智能最高成就奖!第十一届“吴文俊人工智能科学技术奖”揭晓...

来源:中国人工智能学会文章整理:自央视新闻、北京日报链接:https://content-static.cctvnews.cctv.com/snow-book/video.html?item_id7729020039002188616&t1657962648440&toc_style_idvideo_default&share_towechat&track_…

基于深度强化学习的区域化视觉导航方法​​

基于深度强化学习的区域化视觉导航方法 ​​人工智能技术与咨询​​ 本文来自《上海交通大学学报》,作者李鹏等 在环境中高效导航是智能行为的基础,也是机器人控制领域研究的热点之一.实现自主导航的传统方法是结合一系列硬件和算法解决同步定位和建图、路径规划…

智源就“抄袭事件”发布最新通报:2 处属于抄袭,已得到原作者谅解,相关责任人均已主动离职...

来源:AI前线整理:冬梅大模型论文抄袭事件,终于有了结果。今年 4 月,一篇名为《A Roadmap for Big Model》(大模型路线图)的论文被爆出抄袭,该篇论文中涉及国内 19 家机构和百名 AI 学者&#xf…

人工智能技术在智能制造中的典型应用场景与标准体系研究

人工智能技术在智能制造中的典型应用场景与标准体系研究 人工智能技术与咨询 来源:《中国工程科学》 ,作者李瑞琪等 摘要: 针对人工智能在智能制造领域应用不断深入的趋势,本文基于企业关键绩效指标(KPI&#xff09…

旷视张祥雨:从基础科研的「大」和「统一」,看视觉AI研究新趋势

来源:机器之心在 MegTech 2022 上,旷视研究院基础科研负责人张祥雨表示:“大”和 “统一” 是视觉 AI 基础研究的新趋势。基础模型科研是 AI 创新突破的基石,每一代基础模型的突破都极大程度地促进了视觉 AI 的发展。7 月 15 日&a…

基于位置的知识图谱链接预测

基于位置的知识图谱链接预测 人工智能技术与咨询 本文来自《中文信息学报》,作者张宁豫等 摘 要: 链接预测是知识图谱的补全和分析的基础。由于位置相关的实体和关系本身拥有丰富的位置特征,该文提出了一种基于位置的知识图谱链接预测方法。该方法首…

意识理论综述:众多竞争的意识理论如何相互关联?

来源: 集智俱乐部作者:Anil K. Seth & Tim Bayne译者:李路凯、陈斯信编辑:邓一雪 导语意识和底层的神经活动之间如何联系起来?试图解释这一问题的意识理论层出不穷。然而,随着实验数据积累,…

滑翔导弹末段多约束智能弹道规划

滑翔导弹末段多约束智能弹道规划 人工智能技术与咨询 来源:《光学精密工程》,作者邵会兵等 摘要:滑翔导弹末段飞行时空复杂度高、不确定性强、约束多,给弹道规划与制导算法带来了较大的建模和求解难度。针对这一问题&#xff0…

《时代》杂志:元宇宙时代将改变世界

来源:新智元元宇宙上了Time封面,有点官宣那味儿了!还在纠结会不会错过元宇宙和web3浪潮?清华大学科学史系副教授胡翌霖,这次给你讲个透!元宇宙——下一个数字时代将会改变一切。这是最新一期的Time杂志封面…

空战决策知识构建方法研究

空战决策知识构建方法研究 人工智能技术与咨询 本文来自《系统工程与电子技术》,作者吕跃等 0 引言 随着空战训练以及作战仿真实验的深入, 战训数据随之大量产生, 需要解决“数据丰富, 知识贫乏”的数据应用问题, 挖掘数据背后的空战决策知识, 客观说明“人在回路…

【学会双百讲堂】中国指挥与控制学会“百名专家、百场讲座”第七讲——城市大脑系列学术报告(第一期)...

来源:中国指挥与控制学会中国指挥与控制学会“百名专家、百场讲座”第七讲——城市大脑系列学术报告(第一期)主办单位:中国指挥与控制学会承办单位:中国指挥与控制学会城市大脑专业委员会远望智库北京邮电大学人工智能…

专家:人工智能开始对现实世界产生重大影响​​

专家:人工智能开始对现实世界产生重大影响 ​​人工智能技术与咨询​​ 本文摘自中国日报网 中国日报网11月8日电 据英国《卫报》报道,曾撰写过一本有关人工智能的权威教科书的美国科学家表示,在将人工智能的进步比作原子弹技术的发展时&…