教AI区分因果关系和相关性,将改变下一代 AI 的研发

来源:ScienceAI

编辑:萝卜皮

多年前,AI 领域曾发生过一件荒唐而有趣的事情。

据说,研究人员开发了一种对医院数据进行训练的算法。这个算法发现,「患有哮喘的肺炎患者的治愈表现,比没有哮喘的肺炎患者更好」,因此这个算法向医院建议「不要收治那些患有哮喘的人」。之所以得出这种荒唐的结论,那是因为「它」没有理解出现「这种现象」的原因:患有哮喘的肺炎患者得到了额外的医疗照顾。

人类和动物认知的核心是对因果关系的理解:「事情为什么会发生」以及「我们如何影响世界」。几十年过去了,大多数人工智能仍然缺乏「识别数据中的模式和相关性」的这种能力。

如果不了解因果关系,AI 可能永远无法弄清楚很多事情(例如导致疾病的因素),我们可能也永远无法正确解释概括它(例如深度神经网络输出)。为 AI 提供因果推理,不仅可以使 AI 更具可解释性,而且还可以使 AI 更加稳健、公平,并且——也许是最深刻的——可概括。

为了达成这一目的,计算机科学家需要教计算机以一种新的方式看待世界:将世界看作由「潜在机制驱动」的现象,即使是在这些机制无法从数据中得出的情况下。

「我们正在采取科学假设并将其数学化。」

最近,哥伦比亚大学计算机科学副教授兼哥伦比亚因果人工智能实验室负责人 Elias Bareinboim 开发了一种方法。该方法用于决定,在一种环境中有效的干预措施是否适用于另一种环境,是一种广义智能。

如果我们知道医疗程序可以帮助一家医院的人,它可能会告诉我们该程序是否适用于不同的患者群体;如果我们知道机器人可以在加利福尼亚沙漠中航行,它可能会告诉我们机器人是否可以在火星上运行;它也可能告诉我们需要进行更多的实验。在特定数据集上训练的算法在实际部署应用时经常会失败,那是因为类似以上因果逻辑训练的缺失。提前发现此类问题,可以改进训练过程;也可以根据问题,建议限制人工智能在何时何地可以被信任。

Elias Bareinboim 哥伦比亚因果人工智能实验室负责人

一方面

总结经验教训是人类的老伎俩,Elias Bareinboim 也借鉴了人类的策略。「孩子们一种常见的学习方式是模仿成年人,」他说。最近他团队的工作揭示了,软件算法如何学会模仿专家,即使在没有观察指导专家行为的所有信息的情况下。

下面是一个非常重要的举例,请仔细阅读。

该团队的自动驾驶汽车模拟器通过无人机在上方飞行,使用来自道路的数据训练汽车。在培训期间,「学习者」(指控制自动驾驶汽车模拟器的算法)观察到一位专家在另一辆车后面驾驶。专家根据前方汽车的尾灯进行加速和制动。因为「学习者」看不到灯光,所以认为专家的行为似乎不正常,于是便停止了模仿。但是,当「学习者」被部署在环境中,从路上观察两辆车时;它发现到了辅助信息(两辆车的速度)的存在,这足以替代隐藏变量(尾灯),并用辅助信息来通知汽车模拟器继续模仿。新方法可以系统地搜索环境中的补充信息,从而了解行为的真正原因;这对于现实世界中的 AI 至关重要。

另一方面

概括智能的另一个关键是在系统中构建卓越的归纳推理。假设一个人想要预测一部电影能赚多少钱。我们可能会查看演员表,看看它是否包含大明星。但是,相关性不等于因果关系。其他的称为「混杂因素」的因素可能会影响演员阵容和收入。哥伦比亚大学统计学和计算机科学教授 David Meir Blei 研究了一种称为去混杂因素的方法,该方法在进行预测时解释了一些隐藏的混杂因素。

David Meir Blei 统计学和计算机科学教授。

下面是另一个非常重要的举例,请仔细阅读。

「去混杂因素」起源于全基因组关联研究,目的是利用基因预测性状或疾病。Blei 的见解是,为该方法提供正式的理由,并将其推广到其他领域。在 2019 年的一篇被高度引用的论文中,他表明,该方法可以作用于大型数据集,从而证明「基因对性状」、「吸烟对健康」和「演员对电影」收入的影响。Blei 的「解构者」(Blei 所提到的方法)在推荐系统、社会科学研究和医疗评估方面显示出了强大性能,该领域的许多研究者已经在应用该方法。

Blei 还帮助科学家建立「世界如何运作」的模型。他探索了如何在大型、复杂的数据集中找到模式,并通过假设变量之间的因果关系来使用它们来预测未来。

「我们正在采用科学假设并将其数学化。」他说。例如,他与统计系的副教授 John Patrick Cunningham  联同一组研究人员,正在绘制宇宙的尘埃图。尘埃是不可见的,一个隐藏的变量,影响观察到的变量,如恒星亮度。Blei 帮助科学家们开发了一个概率生成模型,然后将其反转,根据他们所看到的来构建尘埃图。

这就是因果机器学习的神奇之处:将机器学习的大规模能力与因果推理的原则性推理相结合。这将用于开发下一代人工智能技术。

相关报道:

https://magazine.engineering.columbia.edu/focus/ai/foundations/one-thing-leads-to-another

未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)大脑研究计划,构建互联网(城市)大脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。每日推荐范围未来科技发展趋势的学习型文章。目前线上平台已收藏上千篇精华前沿科技文章和报告。

  如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/484113.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Java Socket实现客户端服务端之间的通信

Java Socket Java Socket编程用于在不同JRE上运行的应用程序之间的通信。Java Socket编程可以是面向连接的或无连接的。Socket和ServerSocket类用于面向连接的套接字编程,DatagramSocket和DatagramPacket类用于无连接套接字编程。 此Demo将进行单向客户端和服务器…

数据结构-线性结构

一.线性结构 1.顺序线性表 1.1 线性结构是一种基本的数据结构,具有单一前驱和后继的数据关系描述。 1.2 线性表的存储结构分为顺序存储和链式存储。 1.3 顺序线性表的元素间的逻辑关系无需占用额外的空间来存储。 1.4 一般地,以LOC(a1a_1a1​)表示线性…

脑智前沿科普|虚拟现实如何欺骗你的大脑

来源:公众号(脑与心智毕生发展研究中心CLIMB)编辑:Yezi审阅:mingzlee7虚拟现实(Virtual reality, VR)就像被神奇地传送到另一个世界。这是一项令人兴奋的技术,但当我们戴上耳机后,我们很少停下来…

Linux下Java连接数据库出现 Access denied for user 'root'@'localhost' (using password: YES)错误

一、问题描述 centos 7 终端键入 mysql -u root -p 输入密码后可成功访问数据库,但使用IDEA编写Java代码实现数据库连接时却出现Access denied for user ‘root’‘localhost’ (using password: YES) 错误。 二、解决方法 在刚安装mysql时,系统会默认…

被骗两次?黄仁勋骗过世界的14秒,英伟达押宝未来的元宇宙……

来源:物联网智库在近期召开的计算机图形顶级会议ACM SIGGRAPH 2021 上,英伟达介绍了自研的3D仿真模拟和协作平台Omniverse,并放出了“合成版老黄”的打造过程。有媒体据此报道称——万万没想到,在3个月前的GTC大会中,厨…

QT清单打印程序

1.主要代码 //customer.h文件 #ifndef CUSTOMER_H #define CUSTOMER_H#include <QObject> #include <string>class Customer : public QObject {Q_OBJECT public:explicit Customer(QObject *parent nullptr);Customer(const Customer& customer);void setCo…

图灵奖得主杨立昆:人工智能比你更聪明吗?

来源&#xff1a;混沌巡洋舰人工智能常常被认为是一项将要颠覆世界的技术&#xff0c;从这一概念诞生至今的65年中&#xff0c;无数电影与小说塑造了各种经典的人工智能角色&#xff0c;AI &#xff08;Artificial Intelligence&#xff09;也很快成为人类未来世界蓝图中的重要…

(转)Windows系统、Linux系统 和 Mac OS操作系统 历史由来 与 区别?

目录 1 UNIX 由来 2 Linux 由来 3 Windows与Linux的主要区别 4 关于Linux的一些疑惑 参考资料 目前常见的三大操作系统&#xff1a;Windows系统、Linux系统 和 Mac OS操作系统。 首先&#xff0c;不管是Windows操作系统、Linux系统还是苹果的Mac OS操作系统&#xff0c;甚…

国务院公布《关键信息基础设施安全保护条例》

来源&#xff1a;中国政府网编辑&#xff1a;蒲蒲据中国政府网8月17日消息&#xff0c;《关键信息基础设施安全保护条例》已经2021年4月27日国务院第133次常务会议通过&#xff0c;现予公布&#xff0c;自2021年9月1日起施行。条例指出&#xff0c;国家对关键信息基础设施实行重…

文章推荐 | 城市规划中城市信息学的研究进展

来源&#xff1a;北京城市实验室BCL随着计算机技术的飞速发展&#xff0c;城市信息学作为城市规划领域的一门新兴学科&#xff0c;逐渐引起学术界的关注。城市信息学的兴起给城市规划带来了新的压力&#xff0c;但它也提供了新的城市分析视角。在此背景下&#xff0c;专家小组概…

Matlab基础

一.入门基础 1.基本知识 1.1 输入命令 以分号结尾不会打印变量的值 x 1 y x;1.2 变量命名规则&#xff1a;以字母开头&#xff0c;并且仅包含字母、数字和下划线。 1.3 使用save命令将工作区中的变量保存到MAT文件的MATLAB特定格式文件中,文件名为datafile.mat。可以指定保…

3年规模翻7倍统治 5G、IoT时代,化合物半导体材料深度报告

来源 华西证券编辑&#xff1a;智东西内参作者&#xff1a;吴吉森 等随着 5G、IoT 物联网时代的来临&#xff0c;以砷化镓&#xff08;GaAs&#xff09;、氮化镓&#xff08;GaN&#xff09;、碳化硅&#xff08;SiC&#xff09;为代表的化合物半导体市场有望快速崛起。其中&am…

SpringBoot笔记整理(二)

SpringBoot笔记整理&#xff08;一&#xff09; SpringBoot笔记整理&#xff08;二&#xff09; SpringBoot笔记整理&#xff08;三&#xff09; SpringBoot笔记整理&#xff08;四&#xff09; Spring Boot与日志&#xff08;日志框架、日志配置&#xff09; 1、市面上的日志…

MATLAB图像处理基础

1.导入数据 1.1 使用readtable("")导入数据&#xff0c;并存储在表格中&#xff0c;使用axis equal可以校正坐标轴纵横比。 letter readtable("M.txt"); plot(letter.X,letter.Y) axis equal1.2 range(x)函数返回x的值的范围&#xff0c;即max(x) - min(…

BBWebImage 设计思路

BBWebImage 设计思路 BBWebImage 是高性能 Swift 图片组件&#xff0c;用于图片下载、缓存、编解码、编辑与展示。 GitHub 地址&#xff1a; https://github.com/Silence-GitHub/BBWebImage 效果图 下载、展示并缓存原图 下载、渐进式解码、编辑图片&#xff0c;缓存编辑后的图…

清华本科、港科大准博士被指论文抄袭,网友:这是有技巧的“洗稿”

来源&#xff1a;整理自新智元、Reddit、知乎等不是吧&#xff1f;清华自动化本科&#xff0c;香港科技大学硕士生发表的顶会论文竟然是抄的&#xff1f;而且抄袭对象还是另一篇顶会论文&#xff1f;近日&#xff0c;眼尖的网友发现两篇分别发表在 ICML 2021 和 ICCV 2021 两大…

MATLAB深度学习入门

1. 加载图像 1.1 使用imread函数加载图像&#xff0c;可以加载GIF、JPEG、PNG等大多数标准文件格式图像。 Import an image img imread("file.jpg")1.2 采用**imshow()**来显示图像。 imshow(img)1.3 采用alexnet函数可以创建预定义的深度网络AlexNet的副本。 de…

SpringBoot笔记整理(三)

SpringBoot笔记整理&#xff08;一&#xff09; SpringBoot笔记整理&#xff08;二&#xff09; SpringBoot笔记整理&#xff08;三&#xff09; SpringBoot笔记整理&#xff08;四&#xff09; Web开发 1、使用SpringBoot&#xff1a; 1&#xff09;创建SpringBoot应用&…

图神经网络,如何变深?

来源&#xff1a;智源社区版式制作&#xff1a;Camel撰文&#xff1a;侯振宇编辑&#xff1a;贾 伟现实世界中很多很多任务可以描述为图(Graph)问题&#xff0c;比如社交网络&#xff0c;蛋白质结构&#xff0c;交通路网数据&#xff0c;图是一个很值得研究的领域。近年来&am…

机器学习分类与性能度量

机器学习分类与性能度量 数据集:训练集(Training Set)、验证集(Validation Set)和测试集(Test Set) 1、 当模型无需人为设定超参数&#xff0c;所用参数都通过学习得到&#xff0c;则不需要验证集。验证集适合多个不同超参数训练多个模型&#xff0c;通过验证集&#xff0c;…