【Python实战因果推断】34_双重差分5

目录

Identification Assumptions

Parallel Trends

No Anticipation Assumption and SUTVA


Identification Assumptions

您现在可能已经知道,因果推断是统计工具和假设之间的不断互动。在本文中,我选择从统计工具入手,展示 DID 如何利用单位和时间关系来估计治疗效果。这给了你一个具体的例子。现在,是时候深入探讨一下,在使用 DID 时,你做出了什么样的假设,有时甚至没有意识到这一点。

Parallel Trends

在本书之前的章节中,在处理横截面数据时,一个关键的识别假设是干预与潜在的结果无关,以观察到的协变量为条件。DID 有一个类似但较弱的假设:平行趋势。

仔细想想,DID 估计器在利用时间和单位相关性方面是非常直观的。如果只有单位(没有时间维度),就必须使用对照组来估计治疗组的 Y(0)。另一方面,如果有时间维度,但没有对照组(所有单位都在某个时间点接受过治疗),则必须使用接受治疗单位过去的 Y(0) 进行前后比较。这两种方法都需要很强的假设。您要么必须假定对照组的结果可以确定 E[Y(0) | D=1,Post=1],这只有在治疗组和对照组具有可比性的情况下才可行(比如在 RCT 中);要么假定治疗单位的结果是一条跨时间的平线,在这种情况下,您可以使用治疗单位过去的结果来确定 E[Y(0) | D=1,Post=1]。相比之下,"差分法 "做了一个较弱的假设:在没有干预的情况下,干预组和对照组在不同时间的结果轨迹平均是相同的。它假设 Y(0) 的趋势是平行的:

E\Big[Y(0)_{it = 1}-Y(0)_{it = 0}\Big|D=1\Big]=E\Big[Y(0)_{it = 1}-Y(0)_{it = 0}\Big|D=0\Big]

这个假设是无法检验的,因为它包含了一个不可观测的项: E\big[Y(0)_{it=1}\big|D=1\big] 。不过,为了便于理解,我们还是暂时假设你可以观察到所有时间段的 Y(0) 潜在结果。在下面的图中,我用虚线表示它们。在这里,你可以看到干预和对照组四个时段的潜在结果 Y(0)。此外,每幅图都有四个点,分别代表治疗组和对照组的观察数据,以及在对照组下治疗组的 DID 估计轨迹,用虚线表示。虚线与治疗组干预后结果之间的差值就是 ATT 的 DID 估计值。

而真正的 ATT 是治疗组治疗后干预结果与灰色虚线之间的差值,灰色虚线代表治疗组未观察到的 Y(0)

在第一幅图中,估计值和实际值 Y(0)|D=1 相吻合。在这种情况下,平行趋势假设得到满足,DID 估计器恢复了真实 ATT。在第二幅图中,趋势趋同。对于 Y(0)|D=1,估计趋势比实际趋势陡峭。因此,DID 估计值会向下偏倚:E[Y(1)|D=1,Post=1] 与估计趋势之间的差异小于 E[Y(1)|D=1,Post=1] 与实际但不可观测的 E[Y(0)|D=1,Post=1] 之间的差异。

最后,最后一幅图显示了平行趋势假设并不是规模不变的。这幅图只是将第一幅图中的数据进行对数变换,然后对结果进行对数变换。这种变换将原本平行的趋势变成了收敛趋势。我展示这幅图是为了提醒大家在使用 DID 时要非常小心。例如,如果您有水平数据,但想用百分比变化来衡量效果,那么将结果转换成百分比会扰乱您的趋势。

平行趋势假设与条件独立性假设(CIA)有另一种联系。条件独立假设指出,平均而言,治疗组和对照组的 Y(0) 水平是相同的,而平行趋势则指出,治疗组和对照组的 Y(0) 增长是相同的。这可以用您之前看到的 ΔYs 来表示:

(\Delta y_0,\Delta y_1)\perp T

面板数据的威力就在这里:即使干预不是随机分配的,只要干预组和对照组具有相同的反事实增长,ATT 就能被识别出来。

就像独立性假设一样,可以将平行趋势假设放宽到以协变量为条件。也就是说,给定一组干预前协变量 X,Y(0) 的趋势在干预组和对照组之间是相同的。稍后将介绍如何在 DID 中纳入协变量。

No Anticipation Assumption and SUTVA

如果说平行趋势假设可以看作是独立性假设的面板数据版本,那么无预期假设则更多地与处理值稳定单位假设(SUTVA)相关。还记得当效应从干预单位溢出到对照单位(或反之亦然)时,会发生违反 SUTVA 的情况吗?那么,这里的情况是一样的,只不过是跨时间段:你不希望效果溢出到尚未干预的时间段。

如果您认为这种情况不可能发生,那么请考虑一下您正试图估计 "黑色星期五 "对手机销售的影响。如果您尝试这样做,您会发现许多商家都会预期 "黑色星期五 "的折扣,因为他们知道在 "黑色星期五 "之前的那段时间,顾客已经在购买产品了。这很可能会让你在干预(黑色星期五)发生之前就看到销售高峰。

您需要担心时间溢出效应,但这并不意味着您不需要担心单位溢出效应。古老的 SUTVA 仍然是面板数据分析中的一个大问题,尤其是当单位是一个地理区域时。这是因为人们会不断跨越地理边界,这使得干预很可能会溢出被干预单位。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/871202.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

数据结构之单链表(赋源码)

数据结构之单链表 线性表 线性表的顺序存储结构,有着较大的缺陷 插入和删除操作需要移动大量元素。会耗费很多时间增容需要申请空间,拷贝数据,释放旧空间。会有不小的消耗即使是使用合理的增容策略,实际上还会浪费许多用不上的…

led灯什么牌子的质量好?口碑前五的led灯推荐

每每到开学季,学生们重返校园,各个家长和学生们也迎接新学期的前期准备工作,当然,用眼健康的考量也列位其中,国内的学习压力大一直是众所周知的,学生除了在学校长时间用眼外,短暂的户外休息时间…

为什么有些3d模型不能编辑?---模大狮模型网

在展览3D模型设计行业中,设计师们面临一个重要的技术挑战:为什么有些3D模型在某些情况下变得难以编辑?这一问题不仅关乎技术操作的复杂性,更深层次地影响着设计工作的效率和成果质量。本文将探讨这一问题的根本原因及其在实际工作中的具体表…

JSONObject和Map<String, Object>的转换

一、前言 Java开发中出参返回和入参传入更灵活的方法是使用Map<String, Object>入参或出参&#xff0c;或者使用JSONObject。 1、好处&#xff0c;参数可变&#xff0c;对接口扩展性很友好。 public ResponseData<WXModelDTO> getUserInfo(RequestBody Map<…

浏览器输入URL后的过程

总体流程&#xff1a; 1. 用户输入URL并按下回车 当用户在浏览器的地址栏中输入一个 URL 并按下回车&#xff0c;浏览器开始解析用户输入并判断这是一个合法的 URL。 2. DNS 解析 缓存查找&#xff1a;浏览器首先查看本地 DNS 缓存中是否有对应的 IP&#xff0c;如果有则直接…

九盾安防丨如何判断叉车是否超速?

在现代物流和生产流程中&#xff0c;叉车是提高效率和降低成本的关键工具。然而&#xff0c;叉车的高速行驶也带来了安全隐患&#xff0c;这就要求我们对其进行严格的安全管理。九盾安防&#xff0c;作为业界领先的安防专家&#xff0c;今天就为大家揭晓如何判断叉车是否超速&a…

Java高频面试基础知识点整理7

干货分享&#xff0c;感谢您的阅读&#xff01;背景​​​​​​高频面试题基本总结回顾&#xff08;含笔试高频算法整理&#xff09; 最全文章见&#xff1a;Java高频面试基础知识点整理 &#xff08;一&#xff09;Java基础高频知识考点 针对人员&#xff1a; 1.全部人员都…

SCI一区级 | Matlab实现NGO-CNN-LSTM-Mutilhead-Attention多变量时间序列预测

SCI一区级 | Matlab实现NGO-CNN-LSTM-Mutilhead-Attention多变量时间序列预测 目录 SCI一区级 | Matlab实现NGO-CNN-LSTM-Mutilhead-Attention多变量时间序列预测预测效果基本介绍程序设计参考资料 预测效果 基本介绍 1.Matlab实现NGO-CNN-LSTM-Mutilhead-Attention北方苍鹰算…

【机器学习】Exam4

实现线性不可分logistic逻辑回归 我们目前所学的都是线性回归&#xff0c;例如 y w 1 x 1 w 2 x 2 b y w_1x_1w_2x_2b yw1​x1​w2​x2​b 用肉眼来看数据集的话不难发现&#xff0c;线性回归没有用了&#xff0c;那么根据课程所学&#xff0c;我们是不是可以增加 x 3 x…

论文翻译:Large Language Models for Education: A Survey

目录 大型语言模型在教育领域的应用&#xff1a;一项综述摘要1 引言2. 教育中的LLM特征2.1. LLMs的特征2.2 教育的特征2.2.1 教育发展过程 低进入门槛。2.2.2. 对教师的影响2.2.3 教育挑战 2.3 LLMEdu的特征2.3.1 "LLMs 教育"的具体体现2.3.2 "LLMs 教育"…

linux——线程

线程概念 什么是线程&#xff1f; 在一个程序里的一个执行流叫做线程。一切进程至少有一个线程线程在进程内部运行&#xff0c;本质是在进程地址空间内运行在Linux系统中&#xff0c;在CPU眼中&#xff0c;看到的PCB都要比传统的进程更加轻量化 我们都知道在每一个进程都有属…

Ubuntu 22.04.4 LTS (linux) Auditd 安全审计rm命令 记录操作

1 audit增加rm 规则 #sudo vim /etc/audit/rules.d/audit.rules -w /bin/rm -p x -k delfile #重新启动服务 sudo systemctl restart auditd #查看规则 sudo auditctl -l -w /bin/rm -p x -k delfile 2 测试规则 touch test.txt rm test.tx 3 查看日志 sudo ausear…

Apache-Flink未授权访问高危漏洞修复

漏洞等级 高危漏洞!!! 一、漏洞描述 攻击者没有获取到登录权限或未授权的情况下,或者不需要输入密码,即可通过直接输入网站控制台主页面地址,或者不允许查看的链接便可进行访问,同时进行操作。 二、修复建议 根据业务/系统具体情况,结合如下建议做出具体选择: 配…

无人机之遥控器分类篇

一、传统遥控器 传统无人机遥控器一般包括开关键、遥控天线等基础装置。但是会随着无人机具体的应用和功能而开发不同的按键。它的信号稳定性远超对比其他遥控&#xff0c;而且遥控距离也更远&#xff08;一般遥控范围在100米或以上&#xff09;传统遥控器对于初学者来说比较难…

在uniapp中如何使用地图

1&#xff0c;技术选择 最好是使用webview html形式加载&#xff0c;避免打包app时的地图加载问题 2&#xff0c;webview使用 使用webview必须按照官方文档,官网地址&#xff1a;https://uniapp.dcloud.net.cn/component/web-view.html <template><view><!…

KNN分类算法与鸢尾花分类任务

鸢尾花分类任务 1. 鸢尾花分类步骤1.1 分析问题&#xff0c;搞定输入和输出1.2 每个类别各采集50朵花1.3 选择一种算法&#xff0c;完成输入到输出的映射1.4 第四步&#xff1a;部署&#xff0c;集成 2. KNN算法原理2.1 基本概念2.2 核心理念2.3 训练2.4 推理流程 3. 使用 skle…

elasticsearch 查询超10000的解决方案

前言 默认情况下&#xff0c;Elasticsearch集群中每个分片的搜索结果数量限制为10000。这是为了避免潜在的性能问题。 但是我们 在实际工作过程中时常会遇到 需要深度分页&#xff0c;以及查询批量数据更新的情况 问题&#xff1a;当请求form size >10000 时&#xff0c…

【FreeRTOS】IAR的FreeRTOSConfig.h中在添加头文件的问题

1、今天在\FreeRTOSConfig.h中添加个头文件&#xff0c;总是在头文件的函数定义处报错&#xff1a; Error[40]: Bad instruction 2、百度了半天也没有找到问题 3、原来是这个原因&#xff1a; IAR的Freertos中需加上一个portasm.s的驱动文件&#xff0c;而该文件需要调…

印尼Facebook直播网络需要达到什么要求?

在全球化浪潮的推动下&#xff0c;海外直播正受到企业、个人和机构的广泛关注和青睐。无论是用于营销、推广还是互动&#xff0c;海外直播为各种组织提供了更多机会和可能性。本文将探讨在进行印尼Facebook直播前&#xff0c;需要满足哪些网络条件以确保直播的质量和用户体验。…