【斯坦福因果推断课程全集】2_无混淆和倾向分1

目录

Beyond a single randomized controlled trial

Aggregating difference-in-means estimators

Continuous X and the propensity score


随机试验的一个最简单的扩展是无约束下的干预效果估计。从定性上讲,当我们想估计一种并非随机的治疗效果,但一旦我们控制了一组协变量Xi,其效果就和随机的一样好时,无边界性就与此相关。

本讲座的目的就是讨论在这种无边界假设下平均干预效果的识别和估计。与之前一样,我们将采用非参数方法: 我们不会假设任何参数模型的良好规范,平均治疗效果的识别将完全由设计(即与潜在干预结果和治疗相关的条件独立性声明)驱动。

Beyond a single randomized controlled trial

我们通过潜在干预结果来定义治疗的因果效应。对于二元干预 w∈{0, 1},我们定义潜在结果 Yi(1)和 Yi(0),分别对应第 i 个受试者在接受或不接受干预时会经历的结果。我们假设 SUTVA,Y_i = Y_i(W_i),并希望估计平均干预效果

\text{ATE}=\mathbb{E}\left[Y_i(1)-Y_i(0)\right]

在第一讲中,我们假设随机干预分配,\{Y_i(0), Y_i(1)\}\perp W_i,并研究了 ATE 的几个 √n 一致性估计器。

超越一个 RCT 的最简单方法是考虑两个 RCT。举个具体例子,假设我们对给予青少年现金奖励以阻止他们吸烟感兴趣。加利福尼亚州帕洛阿尔托市 5%的青少年和瑞士日内瓦 20%的青少年有资格参加这项研究。

在每个城市内,我们都进行了随机对照研究,事实上很容易看到干预有所帮助。然而,查看总体数据会产生误导,看起来干预会造成伤害;这就是有时被称为辛普森悖论的一个例子:一旦我们汇总数据,这就不再是一项 RCT,因为日内瓦人既更有可能接受治疗,也更有可能无论是否接受治疗都吸烟。为了得到一致的 ATE 估计值,我们需要分别估计每个城市的干预效果:\begin{aligned} &\hat{\tau}_{\mathrm{PA}}=\frac{5}{152+5}-\frac{122}{2362+122}\approx-1.7\%, \\ &\hat{\tau}_{\mathrm{GVA}}=\frac{350}{350+581}-\frac{1979}{2278+1979}\approx-8.9\% \\ &\begin{aligned}\hat{\tau}=\frac{2641}{2641+5188}\hat{\tau}_{\mathrm{PA}}+\frac{5188}{2641+5188}\hat{\tau}_{\mathrm{GVA}}\approx-6.5\%.\end{aligned} \end{aligned}

这个估计器的统计特性是什么?这个想法是如何推广到连续的x呢?

Aggregating difference-in-means estimators

假设协变量 Xi 在离散空间 Xi∈X 中取值,|\mathcal{X}|=p<\infty。再假设治疗分配是以 Xi 为条件的随机分配(即每组都有一个由 x 水平定义的 RCT):\{Y_i(0), Y_i(1)\} \perp W_i \big| X_i=x, \text{for all} x\in\mathcal{X}.

定义组内平均治疗效果为\tau(x)=\mathbb{E}\begin{bmatrix}Y_i(1)-Y_i(0)&X_i=x\end{bmatrix}

然后,如上所述,我们可以通过聚合组级治疗效果估计来估计ATE τ,

\begin{aligned}\hat{\tau}_{AGG}=\sum_{x\in\mathcal{X}}\frac{n_x}{n}\hat{\tau}(x),\quad\hat{\tau}(x)=\frac{1}{n_{x1}}\sum_{\{X_i=x,W_i=1\}}Y_i-\frac{1}{n_{x0}}\sum_{\{X_i=x,W_i=0\}}Y_i,\end{aligned}

其中 n_x=|\{i:X_i=x\}|\begin{aligned}n_{xw}=|\{i:X_i=x, W_i=w\}|\end{aligned}。这个估计值有多好?直观地说,我们需要估计 |\mathcal{X}|=p 个 "参数",因此我们可能期望方差与 p 成线性关系?

为了研究这个估计值,我们可以把它写成下面这样。首先,对于任何具有协变量 x 的组,将 e(x) 定义为在该组中得到治疗的概率,e(x)=\mathbb{P}\left[W_{i}=1 \big| X_{i}=x\right] ,并注意到

\sqrt{n_x}\left(\hat{\tau}(x)-\tau(x)\right)\Rightarrow\mathcal{N}\left(0, \frac{\text{Var}\left[Y_i(0) \big| X_i=x\right]}{1-e(x)}+\frac{\text{Var}\left[Y_i(1) \big| X_i=x\right]}{e(x)}\right)

此外,根据 \mathrm{Var}\begin{bmatrix}Y(w)&X=x\end{bmatrix} =\sigma^{2}(x) 不依赖于 w 的简化假设,我们可以得到

\sqrt{n_x}\left(\hat{\tau}(x)-\tau(x)\right)\Rightarrow\mathcal{N}\left(0, \frac{\sigma^2(x)}{e(x)(1-e(x))}\right).

接下来,对于集合估计器,将 \hat{\pi}(x) = n_x/n 定义为 X_{i}=x 的观测值的比例,将 \pi(x)=\mathbb{P}\left[X_i=x\right] 定义为其期望值,我们可以得出

把这些部分放在一起,我们得到了\sqrt{n}\left(\hat{\tau}_{AGG}-\tau\right)\Rightarrow\mathcal{N}\left(0,V_{AGG}\right)

\begin{gathered} V_{AGG} =\mathrm{Var}\left[\tau(X_{i})\right]+\sum_{x\in\mathcal{X}}\pi^{2}(x)\frac{1}{\pi(x)}\frac{\sigma^{2}(x)}{e(x)(1-e(x))} \\ =\mathrm{Var}\left[\tau(X_i)\right]+\mathbb{E}\left[\frac{\sigma^2(X_i)}{e(X_i)(1-e(X_i))}\right]. \end{gathered}

值得注意的是渐近方差 VAGG 并不依赖于组数 |\mathcal{X}|=p,正如我们稍后将看到的,这一事实在观察研究中有效地进行平均干预效果的半参数推断方面起着关键作用。

Continuous X and the propensity score

在上文,我们考虑了 X 是离散的、水平数有限的情况,治疗 Wi 如(2.1)中 Xi = x 的条件一样是随机的。在这种情况下,我们发现仍然可以通过汇总组内治疗效果估计值来准确估计 ATE,而且组的确切数目 |X | = p 并不影响推论的准确性。然而,如果 X 是连续的(或 X 的卡方数非常大),这一结果就不能直接应用--因为我们无法为 x∈X 的每个可能值获得足够的样本,从而无法像(2.3)中那样定义 τ (x)。

为了将我们的分析推广到离散-X 的情况之外,我们不能再简单地试图通过简单平均来估计每个 x 值的τ (x),而是要使用更间接的论证。为此,我们首先需要概括 "每组都有 RCT "的假设。在形式上,我们只需写出同样的内容

\{Y_i(0),Y_i(1)\}\perp W_i \big| X_i,\quad(2.6)

尽管现在 Xi 可能是一个任意的随机变量,对这句话的解释可能需要更加谨慎。从定性的角度来看,对(2.6)的一种理解是,我们已经测量了足够多的协变量来捕捉 Wi 与潜在结果之间的任何依赖关系,因此在给定 Xi 的情况下,Wi 无法 "窥视"{Yi(0), Yi(1)} 。我们称这一假设为unconfoundedness.

假设 (2.6) 似乎很难在实际中使用,因为它涉及到连续随机变量的条件。然而,正如 Rosenbaum 和 Rubin(1983 年)所指出的,通过考虑倾向得分 e(x)=\mathbb{P}\begin{bmatrix}W_i=1 \big| X_i=x\end{bmatrix}

从统计学上看,倾向得分的一个关键属性是,它是一个平衡得分:如果(2.6)成立,那么实际上

\{Y_i(0),Y_i(1)\}\perp W_i | e(X_i),\quad(2.8)

 也就是说,实际上只需要控制 e(X)而不是 X,就可以消除与非随机干预分配相关的偏差。我们可以通过以下方法验证这一说法:

\begin{aligned} &\mathbb{P}\left[W_{i}=w \big| \{Y_{i}(0), Y_{i}(1)\big\} , e(X_{i})\right] \\ &=\int_{\mathcal{X}}\mathbb{P}\left[W_i=w \big| \{Y_i(w)\} ,X_i=x\right]\mathbb{P}\left[X_i=x \big| \{Y_i(w)\} , e(X_i)\right] dx \\ &=\int_{\mathcal{X}}\mathbb{P}\left[W_i=w \big| X_i=x\right]\mathbb{P}\left[X_i=x \big| \big\{Y_i(w)\big\} , e(X_i)\right] dx\quad\text{(unconf.)} \\ &=e(X_{i})\mathbf{1}_{w=1}+(1-e(X_{i}))\mathbf{1}_{w=0}. \end{aligned}

(2.8)的含义是,如果我们能将观察结果划分为倾向得分 e(x)值(几乎)恒定的组别,那么我们就能通过 \hat{\tau}_{AGG} 的变体持续估计平均干预效果。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/45126.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

数列分块<2>

本期是数列分块入门<2>。该系列的所有题目来自hzwer在LOJ上提供的数列分块入门系列。 Blog:http://hzwer.com/8053.html sto hzwer orz %%% [转载] 好像上面的链接↑打不开&#xff0c;放一个转载:https://www.cnblogs.…

tensorflow卷积层操作

全连接NN&#xff1a; 每个神经元与前后相邻层的每一个神经元都有全连接关系。输入是特征&#xff0c;输出为预测结果。 参数个数(前层*后层后层&#xff09; 实际应用时&#xff0c;会先对原始图像进行特征提取&#xff0c;再把提取到的特征送给全连接网络 会先进行若干层提…

C嘎嘎类与对象上篇

类的定义 1. class为定义类的关键字&#xff0c;Stack为类的名字&#xff0c;{}中为类的主体&#xff0c;注意类定义结束时后⾯分号不能省略 。类体中内容称为类的成员&#xff1a;类中的变量称为类的属性或成员变量; 类中的函数称为类的⽅法或者成员函数。 2. C中struct也可以…

【C语言】C语言-学生籍贯信息记录系统(源码+论文)【独一无二】

&#x1f449;博__主&#x1f448;&#xff1a;米码收割机 &#x1f449;技__能&#x1f448;&#xff1a;C/Python语言 &#x1f449;公众号&#x1f448;&#xff1a;测试开发自动化【获取源码商业合作】 &#x1f449;荣__誉&#x1f448;&#xff1a;阿里云博客专家博主、5…

泛微e-cology getFileViewUrl接口存在SSRF漏洞复现 [附POC]

文章目录 泛微e-cology getFileViewUrl接口存在SSRF漏洞复现 [附POC]0x01 前言0x02 漏洞描述0x03 影响版本0x04 漏洞环境0x05 漏洞复现1.访问漏洞环境2.构造POC3.复现0x06 修复建议泛微e-cology getFileViewUrl接口存在SSRF漏洞复现 [附POC] 0x01 前言 免责声明:请勿利用文章…

【密码学】哈希函数与加密算法的关系

一、哈希函数的定义 哈希函数&#xff08;Hash Function&#xff09;&#xff0c;也被称为散列函数或杂凑函数&#xff0c; 是一种将任意长度的输入数据&#xff08;通常称为“预映射”或“消息”&#xff09;转换为固定长度输出&#xff08;通常称为“哈希值”、“散列值”、“…

PHP红包拓客微信小程序系统源码

&#x1f389;红包狂欢&#xff0c;客源滚滚来&#xff01;红包拓客微信小程序&#xff0c;营销新利器&#x1f680; &#x1f9e7;一、创意红包&#xff0c;吸引眼球 你还在为如何吸引顾客而烦恼吗&#xff1f;红包拓客微信小程序来帮你&#xff01;&#x1f381; 它以创意红…

基于jeecgboot-vue3的Flowable流程-集成仿钉钉流程(六)仿钉钉流程的转bpmn流程图

因为这个项目license问题无法开源&#xff0c;更多技术支持与服务请加入我的知识星球。 1、转bpmn流程图接口 /*** 转为bpmn xml格式* param processModel* throws IOException*/PostMapping("/ddtobpmnxml")public Result<?> ddToBpmnXml(RequestBody Proce…

TIA博途Wincc中画箭头和管道的具体方法示例

TIA博途Wincc中画箭头和管道的具体方法示例 如何画箭头? 如下图所示,在右侧的工具箱中找到基本对象—线,点击选中, 如下图所示,在画面中添加一条线段,然后右键进入该线段的属性,设置线的外观: 宽度、样式、颜色; 线端:这里可以选择起始和结束的样式,选择“箭头”,则…

自闭症孩子能否正常上普校:一场充满挑战与希望的探讨

在教育的舞台上&#xff0c;自闭症孩子​​​​​​​能否正常融入普通学校&#xff0c;是一个备受关注且充满争议的话题。 支持自闭症孩子上普校的观点认为&#xff0c;普通学校能为他们提供更接近真实社会的环境。在普校中&#xff0c;自闭症孩子有机会与不同类型的同学交流互…

IDEA实现热部署

什么是热部署&#xff1f; 热部署&#xff08;Hot Deployment&#xff09;是指在应用程序运行过程中&#xff0c;无需停止整个应用程序或重新启动服务器&#xff0c;就能够部署新的代码、资源或配置文件&#xff0c;使其立即生效。这种部署方式有助于提高开发效率和系统的可用性…

【系统架构设计】计算机组成与体系结构(三)

计算机组成与体系结构&#xff08;三&#xff09; 计算机系统组成存储器系统主存储器辅助存储器Cache存储器Cache 基本原理映射机制直接映射全相联映射组相联映射 替换算法写操作 流水线&#xff08;计算&#xff09;流水线周期流水线执行时间流水线的吞吐率流水线的加速比 计算…

卷积是如何计算的

使用代码&#xff0c;看卷积是如何计算的。 torch.nn torch.nn.functional srtide 的用法&#xff0c;代表卷积核的步幅 import torch import torch.nn.functional as F # 这个是输入的一个二维矩阵 input torch.tensor([[1,2,0,3,1],[0,1,2,3,1],[1,2,1,0,0],[5,2,3,1,1],…

Javascript[ECMAScript] 新特性—1

背景 JS1.1&#xff08;1997&#xff09; 第一版基于Netscape Navigator 3.0中实现的JAVASCRIPT 1.1 JS1.2&#xff08;1999&#xff09; 基于Netscape Navigator 4.0中实现的JavaScript 1.2。添加了正则表达式、更好的字符串处理、新的控制语句、Try/Catch异常处理、更严格…

推荐3个提升工作效率的实用电脑工具

PearOCR PearOCR是一款基于网络的光学字符识别&#xff08;OCR&#xff09;工具&#xff0c;旨在通过先进的图像处理和机器学习技术&#xff0c;快速、准确地从图片中提取文字。该工具的所有功能完全免费&#xff0c;这主要得益于其所有文件都在本地进行识别&#xff0c;不需要…

完美解决:MySQL8报错:Public Key Retrieval is not allowed

在配置数据源的时候直接将属性allowPublicKeyRetrieval设置为true即可 &AutoReconnecttrue

使用getopt处理参数

文章目录 使用getopt处理参数1. shift 命令1.1 删除一个参数1.2 删除多个参数1.3 多次执行 shift 参数1.4 参数解析示例1.5 优化处理1.6 问题处理 2. getopt 命令2.1 常用参数及示例2.2 脚本参数优化示例2.3 参数校验 3. 示例展示4. eval 命令4.1 示例示例 1示例 2示例 3示例 4…

33 IRF配置思路

IRF配置思路网络括谱图 主 Ten-GigabitEthernet 1/0/49 Ten-GigabitEthernet 1/0/50 Ten-GigabitEthernet 1/0/51 备 Ten-GigabitEthernet 2/0/49 Ten-GigabitEthernet 2/0/50 Ten-GigabitEthernet 2/0/51 思路 主 1 利用console线进入设备的命令行页面去更改…

【C语言】C语言-身份证管理系统(源码+注释)【独一无二】

&#x1f449;博__主&#x1f448;&#xff1a;米码收割机 &#x1f449;技__能&#x1f448;&#xff1a;C/Python语言 &#x1f449;公众号&#x1f448;&#xff1a;测试开发自动化【获取源码商业合作】 &#x1f449;荣__誉&#x1f448;&#xff1a;阿里云博客专家博主、5…

关于.NETCORE站点程序部署到nginx上无法访问静态文件和无法正确生成文件的问题解决过程。

我的netcore6项目&#xff0c;部署到IIS的时候&#xff0c;生成报告时&#xff0c;需要获取公司LOGO图片放到PDF报告文件中&#xff0c;这时候访问静态图片没有问题。 然后还有生成邀请二维码图片&#xff0c;这时候动态创建图片路径和图片也没有问题&#xff0c;可以在站点的…