【因果推断python】2_因果关系初步2

目录

偏差

关键思想


偏差

偏差是使关联不同于因果关系的原因。幸运的是,我们的直觉很容易理解。让我们在课堂示例中回顾一下我们的平板电脑。当面对声称为孩子提供平板电脑的学校会获得更高考试成绩的说法时,我们可以反驳说,即使没有平板电脑,这些学校也可能会获得更高的考试成绩。那是因为他们可能比其他学校有更多的钱;因此,他们可以支付更好的教师,负担更好的教室,等等。换句话说,经过处理的学校(使用平板电脑)与未经处理的学校没有可比性。

用潜在结果符号表示这一点就是说处理的Y_{0}与未处理的Y_{0}不同。我们可以说,接受处理的学校的Y_{0}可能大于未处理学校的Y_{0}。这是因为有能力为孩子提供平板电脑的学校也可以负担其他有助于提高考试成绩的因素。习惯谈论潜在的结果需要一些时间。再读一遍这一段,确保你理解它。

考虑到这一点,我们可以用非常简单的数学来说明为什么关联不是因果关系。关联是通过E[Y|T=1]-E[Y|T=0]来衡量的。在我们的示例中,这是有平板电脑的学校的平均考试成绩减去没有平板电脑的学校的平均考试成绩。另一方面,因果关系由E[Y_{1}-Y_{0}]衡量,为了了解它们之间的关系,让我们进行关联测量并将观察到的结果替换为潜在结果。对于治疗,观察到的结果是Y_{1}。对于未治疗者,观察到的结果是Y_{0}

现在,让我们加减E[Y_{0}|T=1],这是一个反事实的结果。它说明如果他们没有接受治疗,治疗的结果会是什么。最后,我们对术语重新排序,合并一些期望,然后瞧:这个简单的数学题包含了我们在因果问题中会遇到的所有问题。我不能强调你了解它的方方面面是多么重要。如果你被迫在手臂上纹身,这个方程应该是一个很好的候选者。这是一件非常值得抓住的事情,并且真正理解告诉我们什么,就像一些可以用 100 种不同方式解释的神圣文本。事实上,让我们更深入地了解一下。让我们把它分解成它的一些含义。首先,这个等式说明了为什么关联不是因果关系。正如我们所看到的,关联等于对被治疗者的治疗效果加上一个偏差项。 偏差是由治疗组和对照组在治疗前的差异决定的,也就是说,如果他们都没有接受治疗。当有人告诉我们教室里的平板电脑可以提高学习成绩时,我们现在可以准确地说出为什么我们会怀疑。我们认为,在这个例子中,E[Y_{0}|T=0]<E[Y_{0}|T=1],也就是说,有能力为孩子提供平板电脑的学校比那些不能提供的学校本身表现就会更好,不管是否提供平板电脑

为什么会发生这种情况?一旦我们进入混淆那一章,我们将更多地讨论这一点,但现在你可以想到偏差的产生,因为许多我们无法控制的事情随着干预而发生变化。因此,经过干预和未经干预的学校不仅在平板电脑上有所不同。他们在学费、地点、师资等方面也有所不同……如果我们要说课堂上提供平板电脑可以提高学习成绩,我们需要有和没有平板电脑的学校在其他各方面,彼此相似。

现在我们了解了问题,让我们看看解决方案。我们也可以说使关联等于因果关系是必要的。 如果E[Y_{0}|T=0]=E[Y_{0}|T=1]那么,关联就是因果关系! 理解这一点不仅仅是记住方程式。这里有一个强烈的直觉论证。说E[Y_{0}|T=0]=E[Y_{0}|T=1]就是说干预组和对照组干预前具有可比性。或者,在被处理者没有被处理的情况下,如果我们可以观察到它的Y_{0},那么它的结果将与未处理的相同。在数学上,偏差项会消失:

此外,如果处理和未处理仅在处理本身不同,即 E[Y_{0}|T=0]=E[Y_{0}|T=1]我们认为对处理的因果影响与未处理的相同(因为它们非常相似)。

不仅如此,E[Y_{1}-Y_{0}|T=1]=E[Y_{1}-Y_{0}|T=0],仅仅因为经过处理和未经处理是可以互换的。因此,在这种情况下,手段的差异成为因果效应

再一次,这非常重要,我认为值得再看一遍,现在有漂亮的图片。如果我们在干预组和未干预组之间做一个简单的平均比较,这就是我们得到的(蓝点没有接受治疗,也就是平板电脑):

请注意两组之间的结果差异可能有两个原因:

  1. 干预效果。给孩子平板电脑导致的考试分数增加。
  2. 干预因素本身之外,干预组和未干预组之间的其他差异。在这种情况下,干预组和未干预组的区别在于干预组的学费要高得多。考试成绩的一些差异可能是由于更高的学费带来了更好的教育。

真正的干预效果只有在我们拥有观察潜在结果的神力时才能获得,如下左图所示。个体干预效果是该单位的结果与同一单位在获得替代治疗的情况下将具有的另一个理论结果之间的差异。这些是反事实结果,以浅色表示。

在右边的图中,我们描述了我们之前讨论过的偏差是什么。如果我们让每个人都不接受干预,我们就会产生偏差。在这种情况下,我们只剩下T_{0}潜在结果。然后,我们看到干预组和未干预组有何不同。如果他们这样做,则意味着干预之外的其他因素导致干预组和未干预组的不同。这就是偏差,是真实干预效果的阴影。

现在,将此与没有偏差的假设情况进行对比。假设平板电脑被随机分配给学校。在这种情况下,贫富学校接受干预的机会是一样的。干预因素将很好地分布在所有学费范围内。

在这种情况下,干预和未干预之间的结果差异是平均因果效应。发生这种情况是因为除了干预本身之外,干预组和未干预组之间没有其他差异来源。我们看到的所有差异都必须归因于它。这种情况的另一种说法就是没有偏差。

如果我们将每个人都设置为不接受治疗,只观察Y_{0},我们将发现治疗组和未治疗组之间没有差异。

这就是因果推理的艰巨任务。这是关于寻找消除偏差的巧妙方法,使接受干预的和未接受干预的两组对象具有可比性,以便我们看到的所有差异只是平均干预效果。归根结底,因果推断是要弄清楚世界是如何运转的,排除所有的妄想和误解。现在我们明白了这一点,我们可以继续掌握一些最强大的方法来消除偏见,勇敢和真实的武器来确定因果关系。

关键思想

到目前为止,我们已经看到关联不是因果关系。最重要的是,我们已经确切地看到了为什么它不是,以及我们如何使关联成为因果关系。我们还引入了潜在结果符号,作为围绕因果推理的一种方式。有了它,我们将统计视为两种潜在的现实:一种是给予干预,另一种是不给予干预。但是,不幸的是,我们只能测量其中之一,这就是因果推断的根本问题所在。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/844448.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【ai】livekit:Agents 3 : pythonsdk和livekit-agent的可编辑模式下的安装

livekit-agent 依赖于livekit、livekit-api、livekit-protocol 其中livekit就是livekkit-rtc: 包含俩sdk 实时互动sdkReal-time SDK for connecting to LiveKit as a participant livekit-api : 服务端sdk https://pypi.org/project/livekit-api/ livekit的python sdk

如何应对Android面试官 -> 玩转 Fragment

前言 本章主要讲解下 Framgent 的核心原理&#xff1b; 基础用法 线上基础用法&#xff0c;其他的可以自行百度 FragmentManager manager getSupportFragmentManager(); FragmentTransaction transaction manager.beginTransaction(); transaction.add(R.id.contentlayout,…

2018 年山东省职业院校技能大赛高职组“信息安全管理与评估”赛项任务书

2018年山东省职业院校技能大赛高职组 “信息安全管理与评估”赛项任务书 赛项时间 8:30-13:00&#xff0c;共计4小时30分钟&#xff0c;含赛题发放、收卷时间。 赛项信息 竞赛阶段 任务阶段 竞赛任务 竞赛时间 分值 第一阶段 平台搭建与安全设备配置防护 …

茅台领航,贵州白酒向前冲!

执笔 | 尼 奥 编辑 | 扬 灵 “茅台好&#xff0c;大家才好&#xff1b;大家好&#xff0c;茅台才会更好。”在2024年贵州白酒企业盛宴上&#xff0c;这股自信与豪情再度激荡&#xff0c;大家对茅台与贵州白酒产业的未来充满信心。 5月26日至27日&#xff0c;由贵州省白酒产…

一文读懂python同级目录的调用附Demo(详细解读)

目录 前言1. 问题所示2. 原理分析3. 解决方法3.1 添加父目录3.2 相对路径3.3 添加init 前言 通过制作简易的Demo&#xff0c;让其更加深入的了解如何使用 1. 问题所示 发现python的同级目录相互调用会出Bug E:\software\anaconda3\envs\py3.10\python.exe F:\python_project…

Django 里如何使用 sqlite (操作步骤)

在 settings.py 里&#xff0c;已经设定好 sqlite 了 DATABASES {default: {ENGINE: django.db.backends.sqlite3,NAME: BASE_DIR / db.sqlite3,} }必须得设置好app # 在 settings.py 里INSTALLED_APPS [django.contrib.admin,django.contrib.auth,django.contrib.contentt…

Paddle使用问题No module named ‘paddle.fluid’

这是Paddle版本的问题&#xff0c;从飞桨框架 2.5 版本开始&#xff0c;已经废弃了 paddle.fluid 。 ​解决方案&#xff1a;修改paddle版本 pip install paddlepaddle2.4.0

使用递归形式以及迭代形式实现树的前中后序遍历

相信大家对于二叉树的遍历并不陌生&#xff0c;对于二叉树的递归遍历我们也可以信手拈来。但是如果让我们将二叉树修改成为非递归的形式呢&#xff1f;是不是有点疑惑了&#xff1f;那么本次博客我们就来梳理一下二叉树的非递归遍历。 由于递归遍历二叉树的代码以及逻辑都很简单…

(函数)判断素数(C语言)

一、运行结果&#xff1b; 二、源代码&#xff1b; # define _CRT_SECURE_NO_WARNINGS # include <stdio.h>//声明素数判断函数&#xff1b; void prime(int number);int main() {//初始化变量值&#xff1b;int number 0;//获取用户输入的数据&#xff1b;printf(&quo…

AI在肿瘤学临床决策中的应用:一种多模态方法

在临床肿瘤学领域&#xff0c;多模态人工智能&#xff08;AI&#xff09;系统通过解读各类医学数据&#xff0c;展现出提升临床决策的潜力。然而&#xff0c;这些模型在所有医学领域中的有效性尚未确定。本文介绍了一种新型的多模态医疗AI方法&#xff0c;该方法利用大型语言模…

JAVA 17

文章目录 概述一 语法层面变化1_JEP 409&#xff1a;密封类2_JEP 406&#xff1a;switch模式匹配&#xff08;预览&#xff09; 二 API层面变化1_JEP 414&#xff1a;Vector API&#xff08;第二个孵化器&#xff09;2_JEP 415&#xff1a;特定于上下文的反序列化过滤器 三 其他…

手机投屏技巧:手机怎么投屏到电脑显示屏上?精选6招解决!

手机怎么投屏到电脑显示屏上&#xff1f;出于一些不同的原因&#xff0c;大多数人都希望能将手机投屏到电脑上。其中一个常见的原因是&#xff0c;大家经常会希望在笔记本电脑上共享图片&#xff0c;而无需上传或者登录微信进行文件传输。以及希望不依靠投影仪&#xff0c;就能…

只刷题可以通过PMP考试吗?

咱们都知道&#xff0c;PMBOK那本书&#xff0c;哎呀&#xff0c;读起来确实有点费劲。所以&#xff0c;有些人就想了&#xff0c;干脆我就刷题吧&#xff0c;题海战术&#xff0c;没准儿也能过。这话啊&#xff0c;听起来似乎有点道理&#xff0c;但咱们得好好琢磨琢磨。 刷题…

【YashanDB知识库】自动选举配置错误引发的一系列问题

问题现象 问题出现的步骤/操作&#xff1a; ● 配置自动选举&#xff0c;数据库备库手动发起switch over&#xff0c;命令会报错 ● 主、备库变为只读状态&#xff0c;数据库无法进行读写操作 ● shutdown immediate 停止数据库&#xff0c;此时发现数据库一直没有退出&…

论文笔记:Vision GNN: An Image is Worth Graph of Nodes

neurips 2022 首次将图神经网络用于视觉任务&#xff0c;同时能取得很好的效果 1 方法 2 架构 在计算机视觉领域&#xff0c;常用的 transformer 通常是 isotropic 的架构&#xff08;如 ViT&#xff09;&#xff0c;而 CNN 更喜欢使用 pyramid 架构&#xff08;如 ResNet&am…

开源数据库同步工具DBSyncer

前言&#xff1a; 这么实用的工具&#xff0c;竟然今天才发现&#xff0c;相见恨晚呀&#xff01;&#xff01;&#xff01;&#xff01; DBSyncer&#xff08;英[dbsɪŋkɜː]&#xff0c;美[dbsɪŋkɜː 简称dbs&#xff09;是一款开源的数据同步中间件&#xff0c;提供M…

必看项目|多维度揭示心力衰竭患者生存关键因素(生存分析、统计检验、随机森林)

1.项目背景 心力衰竭是一种严重的公共卫生问题,影响着全球数百万人的生活质量和寿命,心力衰竭的病因复杂多样,既有个体生理因素的影响,也受到环境和社会因素的制约,个体的生活方式、饮食结构和医疗状况在很大程度上决定了其心力衰竭的风险。在现代社会,随着生活水平的提…

使用moquette mqtt发布wss服务

文章目录 概要一、制作的ssl证书二、配置wss小结 概要 moquette是一款不错的开源mqtt中间件&#xff0c;github地址&#xff1a;https://github.com/moquette-io/moquette。我们在发布mqtt服务的同时&#xff0c;是可以提供websocket服务器的&#xff0c;有些场景下需要用到&a…

OpenAI新模型开始训练!GPT6?

国内可用潘多拉镜像站GPT-4o、GPT-4&#xff08;更多信息请加Q群865143845&#xff09;: 站点&#xff1a;https://xgpt4.ai0.cn/ OpenAI 官网 28 日发文称&#xff0c;新模型已经开始训练&#xff01; 一、新模型开始训练 原话&#xff1a;OpenAI has recently begun training…

价值飙升30%,AI PC拉动半导体出货潮

由于处理器和DRAM的升级&#xff0c;大摩预测每台AI PC的半导体价值将增长20%-30%&#xff0c;PC平均售价也将提高7%。 台北国际电脑展即将于6月2日隆重开幕。 随着展会的临近&#xff0c;各种现象级的AI PC也蓄势待发。 就在上周&#xff0c;联想在业绩会上&#xff0c;首次…