目录
Identification Assumptions
Parallel Trends
No Anticipation Assumption and SUTVA
Identification Assumptions
您现在可能已经知道,因果推断是统计工具和假设之间的不断互动。在本文中,我选择从统计工具入手,展示 DID 如何利用单位和时间关系来估计治疗效果。这给了你一个具体的例子。现在,是时候深入探讨一下,在使用 DID 时,你做出了什么样的假设,有时甚至没有意识到这一点。
Parallel Trends
在本书之前的章节中,在处理横截面数据时,一个关键的识别假设是干预与潜在的结果无关,以观察到的协变量为条件。DID 有一个类似但较弱的假设:平行趋势。
仔细想想,DID 估计器在利用时间和单位相关性方面是非常直观的。如果只有单位(没有时间维度),就必须使用对照组来估计治疗组的 。另一方面,如果有时间维度,但没有对照组(所有单位都在某个时间点接受过治疗),则必须使用接受治疗单位过去的 进行前后比较。这两种方法都需要很强的假设。您要么必须假定对照组的结果可以确定 ,这只有在治疗组和对照组具有可比性的情况下才可行(比如在 RCT 中);要么假定治疗单位的结果是一条跨时间的平线,在这种情况下,您可以使用治疗单位过去的结果来确定 。相比之下,"差分法 "做了一个较弱的假设:在没有干预的情况下,干预组和对照组在不同时间的结果轨迹平均是相同的。它假设 的趋势是平行的:
这个假设是无法检验的,因为它包含了一个不可观测的项: 。不过,为了便于理解,我们还是暂时假设你可以观察到所有时间段的 潜在结果。在下面的图中,我用虚线表示它们。在这里,你可以看到干预和对照组四个时段的潜在结果 。此外,每幅图都有四个点,分别代表治疗组和对照组的观察数据,以及在对照组下治疗组的 DID 估计轨迹,用虚线表示。虚线与治疗组干预后结果之间的差值就是 ATT 的 DID 估计值。
而真正的 ATT 是治疗组治疗后干预结果与灰色虚线之间的差值,灰色虚线代表治疗组未观察到的 :
在第一幅图中,估计值和实际值 相吻合。在这种情况下,平行趋势假设得到满足,DID 估计器恢复了真实 ATT。在第二幅图中,趋势趋同。对于 ,估计趋势比实际趋势陡峭。因此,DID 估计值会向下偏倚: 与估计趋势之间的差异小于 与实际但不可观测的 之间的差异。
最后,最后一幅图显示了平行趋势假设并不是规模不变的。这幅图只是将第一幅图中的数据进行对数变换,然后对结果进行对数变换。这种变换将原本平行的趋势变成了收敛趋势。我展示这幅图是为了提醒大家在使用 DID 时要非常小心。例如,如果您有水平数据,但想用百分比变化来衡量效果,那么将结果转换成百分比会扰乱您的趋势。
平行趋势假设与条件独立性假设(CIA)有另一种联系。条件独立假设指出,平均而言,治疗组和对照组的 水平是相同的,而平行趋势则指出,治疗组和对照组的 增长是相同的。这可以用您之前看到的 ΔYs 来表示:
面板数据的威力就在这里:即使干预不是随机分配的,只要干预组和对照组具有相同的反事实增长,ATT 就能被识别出来。
就像独立性假设一样,可以将平行趋势假设放宽到以协变量为条件。也就是说,给定一组干预前协变量 X, 的趋势在干预组和对照组之间是相同的。稍后将介绍如何在 DID 中纳入协变量。
No Anticipation Assumption and SUTVA
如果说平行趋势假设可以看作是独立性假设的面板数据版本,那么无预期假设则更多地与处理值稳定单位假设(SUTVA)相关。还记得当效应从干预单位溢出到对照单位(或反之亦然)时,会发生违反 SUTVA 的情况吗?那么,这里的情况是一样的,只不过是跨时间段:你不希望效果溢出到尚未干预的时间段。
如果您认为这种情况不可能发生,那么请考虑一下您正试图估计 "黑色星期五 "对手机销售的影响。如果您尝试这样做,您会发现许多商家都会预期 "黑色星期五 "的折扣,因为他们知道在 "黑色星期五 "之前的那段时间,顾客已经在购买产品了。这很可能会让你在干预(黑色星期五)发生之前就看到销售高峰。
您需要担心时间溢出效应,但这并不意味着您不需要担心单位溢出效应。古老的 SUTVA 仍然是面板数据分析中的一个大问题,尤其是当单位是一个地理区域时。这是因为人们会不断跨越地理边界,这使得干预很可能会溢出被干预单位。