目录
局部平均干预效果:后期
对参与度的影响
关键思想
局部平均干预效果:后期
局部平均处理效应明确了我们可以估计因果效应的人群。这也是查看 IV 的另一种方式,它提供了我们可以使用的其他很酷的直觉。在现代 IV 中,我们将工具视为启动因果链:Z 导致 T 导致 Y。在这种情况下,排除限制意味着 Z 不会导致 Y,除非通过其对 T 的影响。现在将第一阶段视为Z 对 T 的因果效应。我们还用双索引符号重写潜在结果,其中第一个索引表示工具的反事实,第二个索引表示处理
从某种意义上说,干预成为结果,至少在第一阶段是这样。这意味着我们也可以用潜在的结果符号来写它:
工具变量假设现在可以重写如下
-
和 。这就是独立性假设。这表示该仪器与随机分配的一样好。换句话说,工具变量 Z 与潜在干预无关,这与说不同工具变量组的人具有可比性是相同的。
-
和 。这是排除限制。它说,如果我正在考虑接受干预的潜在结果,那么两个工具变量组的结果都是一样的。换句话说,该工具变量不影响潜在结果,这与说该工具变量仅通过干预影响结果相同。
-
。这是第一阶段的存在。据说第一阶段的潜在结果,即潜在的干预,是不一样的。另一种说法是工具变量确实会影响干预。
-
。这就是单调性假设。据说如果每个人都打开工具变量,干预水平会高于每个人都关闭干预的水平。
现在,让我们回顾一下 Wald 估计量,以进一步了解 IV:
让我们取它的第一位,。使用排除限制,我们可以根据这样的潜在结果重写 Y。使用独立性,我们可以去掉 Z 上的条件。用类似的论证,我们得到我们现在可以像这样重写 Wald 估计量的分子使用单调性,我们知道 是 0 或 1,所以使用类似的论点来解决分母,我们得到所有这一切让我们可以这样看待 Wald 估计量:
也就是说,由 IV 估计的 ATE 是子群上的 ATE,其中 Ti1>Ti0��1>��0。如果您考虑合规性,这是哪个人群?这是那些工具变量影响通道打开后干预水平高于关闭工具变量影响通道的人群。换句话说,这是服从人群。我们可以记住如下几类,
- 服从者意味着
- 永不接受者意味着
- 总是接受者意味着
结论是,IV 没有说明对永不接受者、总是接受者或拒绝者的影响,因为对他们的干预没有改变! IV 仅查找服从者的处理效果。
对参与度的影响
让我们看看所有这一切在案例研究中如何发挥作用,我们尝试估计推送对应用内购买的影响。因果图就是我们上面描述的那个图,这里就不再赘述了。我们拥有的数据是关于推送分配的随机工具和推送交付的干预变量。
data = pd.read_csv("./data/app_engagement_push.csv")data.head()
首先,让我们先跑一个普通线性回归来看看能得到什么
ols = IV2SLS.from_formula("in_app_purchase ~ 1 + push_assigned + push_delivered", data).fit()
ols.summary.tables[1]
OLS 说的干预效果是 R$27.60,也就是说,消息推送增加了 27.6 雷亚尔(巴西货币单位)的应用内购买。 然而,我们有理由相信这是一个有偏的估计。 我们知道旧手机在接收推送时遇到问题,因此,使用新手机的富裕客户可能是服从者。 由于接受干预的人也有更多的钱,我们认为这种有偏是积极的,消息推送(PUSH)的真正影响较小。 换句话说,我们可能有
现在,让我们尝试使用工具变量来估计这种影响。 首先,让我们运行第一阶段。
first_stage = IV2SLS.from_formula("push_delivered ~ 1 + push_assigned", data).fit()
first_stage.summary.tables[1]
看起来我们有一个强大的第一阶段。 那些被指派获得推送的人有 71.8% 的时间得到推送。 这意味着我们有大约 28% 的人从不接受。 我们也有充分的理由相信没有总是接受者,因为截距参数估计为零。 这意味着如果没有分配给它,就没有人得到推送。 鉴于我们的实验设计,这是意料之中的。
现在让我们运行简化的形式的估计:
reduced_form = IV2SLS.from_formula("in_app_purchase ~ 1 + push_assigned", data).fit()
reduced_form.summary.tables[1]
简化形式显示进行干预分配的因果效应为 2.36。 这意味着分配某人接收推送会使应用内购买平均增加 2.36 雷亚尔。
如果我们将简化形式除以第一阶段,我们将工具变量的效果按有实际干预的比例进行缩放,我们得到 2.3636/0.7176=3.292.3636/0.7176=3.29。 运行 2SLS,我们得到这些相同的估计,加上正确的标准误差。
iv = IV2SLS.from_formula("in_app_purchase ~ 1 + [push_delivered ~ push_assigned]", data).fit()
iv.summary.tables[1]
这表明 2SLS 的结果远低于我们使用 OLS 得到的结果:3.29 对 27.60。 这是有道理的,因为使用 OLS 估计的因果效应是正偏差的。 我们还需要记住 LATE。 3.29 是对编译器的平均因果效应。 不幸的是,对于那些从不接受者,我们无话可说。 这意味着我们正在评估对拥有更新手机的较富裕人群的影响。
关键思想
在这里,我们从现代的视角对工具变量加以了更深刻的认识。 我们看到工具变量可以被视为一个因果链,其中工具变量导致干预,干预进而导致结果。 从这个视角出发中,我们学习了服从性,从而理解 IV 估计中的 ATE,并且我们发现它是有服从行为对象的局部平均干预效应(LATE)。