【Python实战因果推断】1_因果效应异质性1

目录

From ATE to CATE

Why Prediction Is Not the Answer

CATE and ITE


本文将介绍应用于行业的因果推理中最有趣的发展:效应异质性。在此之前,你们了解的是一种治疗方法的一般影响。现在,你将专注于发现它如何对不同的人产生不同的影响。治疗效果并非恒定不变,这个想法很简单,但却非常强大。了解哪些单位对某种治疗的反应更好,是决定谁接受治疗的关键。效应异质性为个性化这一备受推崇的理念提供了一种因果推理方法。首先,您将从理论层面了解效应异质性,了解估计效应异质性的挑战是什么,以及如何扩展已学知识以应对这些挑战。接下来,您将看到效应异质性的估算与预测性研究密切相关。
异质性效应与预测问题密切相关,而预测问题对于数据科学家来说已经非常熟悉了。因此,您将看到交叉验证和模型选择的理念如何仍然适用于治疗异质性模型。然而,验证效果估计值比评估简单的预测模型更具挑战性,这就是为什么你会看到一些新颖的方法。
最后提供了一些如何使用效应异质性指导决策的指南和示例。虽然并非详尽无遗,但我希望这些示例能告诉您如何将这些想法用于解决自己的业务问题。

From ATE to CATE

到目前为止,你们每次估算治疗的因果影响时,大多都是平均治疗效果:

\tau=E\bigl[Y_1-Y_0\bigr]或者是等价的连续治疗\tau=E[y'(t)]y'(t)是治疗反应函数的导数。

也就是说,您已经学会了揭示治疗总体有效性的技术。ATE 估算是因果推理的基石。它是一个超级有用的工具,可用于决策问题,也就是所谓的项目评估:当你想知道是否应该在整个人群中推广一种治疗方法时。

现在,是时候学习如何为另一种类型的决策提供信息了:你应该对哪个单位进行治疗?为此,您需要允许决策从一个单位变为另一个单位。

例如,给某个客户提供折扣券可能是有益的,但不给另一个客户,因为某个客户可能对折扣更敏感。或者,将疫苗优先提供给某一群体而不是另一群体也是有道理的,因为这些群体会从这种待遇中获益更多。在这种情况下,个性化是关键。

实现个性化的一种方法是将效果异质性考虑在内,即估算条件平均治疗效果 (CATE)。通过考虑每个单位的独特特征,您可以确定针对该特定案例的最有效治疗方法:E\bigl[Y_1-Y_0\bigl|X\bigr] \mathrm{or} E\bigl[y'(t)\bigl|X\bigr]

以 X 为条件意味着,您现在允许治疗效果因每个单位的协变量 X 所定义的特征而异。同样,在这里,您认为并非所有单位都对治疗有同样好的反应,您希望利用这种异质性。您希望只对合适的单位进行治疗(在二元情况下),或者找出每个单位的最佳治疗剂量(在连续情况下)。

例如,如果您是一家银行,需要决定每位客户有资格获得的贷款额度,那么您可以肯定的是,向每个人发放大量资金并不是一个好主意,尽管这对某些人来说可能是合理的。你必须精明地处理(贷款额度)。也许,根据客户的信用评分,您可以找出合适的贷款额度。当然,您并不需要成为一家大型机构来利用个性化服务。我们不乏这样的例子。您应该在一年中的哪几天进行销售?产品价格应该是多少?每个人的运动量是多少?

Why Prediction Is Not the Answer

可以这样想。您有一群客户和一种处理方法(价格、折扣、贷款......),您想对处理方法进行个性化,例如,给不同的客户不同的折扣。假设您可以按结果图将客户组织成以下处理方式:

您可以将个性化任务视为客户细分问题。您要根据客户对您的处理方式的反应来创建客户群。例如,您想找到对折扣反应好的客户和对折扣反应差的客户。

那么,客户对处理方法的反应由条件处理效果 \frac{\delta Y}{\delta T} 给出。因此,如果您能以某种方式估算出每位顾客的条件处理效果,您就能将那些对处理效果好的顾客(高处理效果)和那些对处理效果差的顾客进行分组。如果能做到这一点,就能像下图一样分割客户空间:

这就太好了,因为现在你可以估算出每个组的不同治疗效果。同样,由于疗效只是治疗反应函数的斜率,如果你能得出斜率不同的组别,那么这些分区的实体对治疗的反应就会不同:

现在,将其与传统的机器学习方法进行对比。您可能会尝试预测 Y,而不是每个单元的导数 \frac{\delta Y}{\delta T}。假定你的预测模型能很好地逼近目标,这将从根本上分割 Y 轴上的空间。然而,这并不一定会导致各组具有不同的治疗效果。这就是为什么简单地预测结果并不总是对决策有用:

好吧,你可能会说,我知道我必须估计效果,而不仅仅是预测结果,但这有点棘手。如果我看不到斜率\frac{\delta Sales}{\delta Discount},我怎么能预测它呢?

说得好。与原始结果 Y 不同,斜率(或变化率)在单位层面上基本上是不可观测的。要想看到单个斜率,就必须观察每个单位在不同处理水平下的情况,并计算每个处理结果的变化情况

\frac{\delta Y_i}{\delta T_i}\approx\frac{Y(T_i)-Y(T_i+\epsilon)}{T_i-(T_i+\epsilon)}

这又是因果推论的根本问题。在不同的治疗条件下,你不可能看到相同的单位。那么,你能做什么呢?

CATE and ITE

请记住,CATE 不同于个体治疗效果(ITE)。例如,假设您有两组病人,x = 1 和 x = 2,每组 4 个单位,您想知道一种新药对一种疾病的治疗效果,这种疾病通常会导致 50%的患者死亡。
对于 x = 1 组,该药物对一名病人不利,导致其死亡,但却挽救了另一名病人。对于 x = 2 组,药物效果为零,其中 1 人死亡(请记住,这种疾病的致死率为 50%)。在这两组中,CATE 都是 0.5,但没有一个单位的 ITE 是 0.5。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/34237.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Java | Leetcode Java题解之第198题打家劫舍

题目&#xff1a; 题解&#xff1a; class Solution {public int rob(int[] nums) {if (nums null || nums.length 0) {return 0;}int length nums.length;if (length 1) {return nums[0];}int first nums[0], second Math.max(nums[0], nums[1]);for (int i 2; i <…

【Oracle篇】逻辑备份工具expdp(exp)/impdp(imp)和物理备份工具rman的区别和各自的使用场景总汇(第八篇,总共八篇)

&#x1f4ab;《博主介绍》&#xff1a;✨又是一天没白过&#xff0c;我是奈斯&#xff0c;DBA一名✨ &#x1f4ab;《擅长领域》&#xff1a;✌️擅长Oracle、MySQL、SQLserver、阿里云AnalyticDB for MySQL(分布式数据仓库)、Linux&#xff0c;也在扩展大数据方向的知识面✌️…

链表数组遍历输出的辨析(二者都含指针的情况下)----PTA期末复习题

输入输出三位学生的学号和信息 一开始我认为是指针&#xff0c;直接背了指针输出的方式&#xff1b;p;p!NULL;pp->next 这个是错误的 下面这个输出是正确的方式 分析怎么区分这两个 举个例子来 数组遍历&#xff1a; 链表遍历&#xff1a; 输出的结果&#xff1a; 如果将…

区块链技术与数字货币

1.起源 ➢中本聪(Satoshi Nakamoto), 2008 ➢比特币:一种点对点的电子现金系统 2.分布式账本技术原理 1.两个核心技术&#xff1a; ➢以链式区块组织账本数据实现账本数据的不可篡改 ➢分布式的可信记账机制 2.共识机制&#xff1a;由谁记账 ➢目的&#xff1a; ⚫ 解…

【数据结构(邓俊辉)学习笔记】二叉搜索树03——平衡

文章目录 1. 极端退化2. 平均高度3. 理想 适度4. 歧义 等价5. 等价变换 1. 极端退化 二叉搜索树为我们同时实现对数据集高效的静态操作以及动态操作打开了一扇新的大门。 正如我们所看到的&#xff0c;从策略上&#xff0c;BST可以视作是试图将此前的向量结构以及列表结构优…

SpringBoot整合MongoDB JPA使用

一、整合MongoDB SpringDataMongoDB是 SpringData家族成员之一&#xff0c;MongoDB的持久层框架&#xff0c;底层封装了 mongodb-driver。mongodb-driver 是 MongoDB官方推出的 Java连接 MongoDB的驱动包&#xff0c;相当于JDBC驱动。 SpringBoot整合 MongoDB&#xff0c;引入…

【Mac】XnViewMP for Mac(图片浏览查看器)及同类型软件介绍

软件介绍 XnViewMP 是一款多功能、跨平台的图像查看和管理软件&#xff0c;适用于 macOS、Windows 和 Linux 系统。它是经典 XnView 软件的增强版本&#xff0c;更加现代化且功能更强大。XnViewMP 支持数百种图像格式&#xff0c;并提供多种图像处理工具&#xff0c;使其成为摄…

【摄像头标定】使用kalibr进行双目摄像头标定(ros1、ros2)

使用kalibr进行双目摄像头标定 前言标定板标定①板端准备和录制②上位机准备和标定 前言 本文不是纯用ros1进行标定&#xff0c;需要ros1和ros2通信。给使用ros2进行开发&#xff0c;但又想用kalibr标定双目摄像头的小伙伴一个教程。本文双目摄像头的数据发布使用ros2&#xf…

收银系统源码-千呼新零售2.0【线上营销】

千呼新零售2.0系统是零售行业连锁店一体化收银系统&#xff0c;包括线下收银线上商城连锁店管理ERP管理商品管理供应商管理会员营销等功能为一体&#xff0c;线上线下数据全部打通。 适用于商超、便利店、水果、生鲜、母婴、服装、零食、百货等连锁店使用。 详细介绍请查看&a…

Js逆向爬虫基础篇

这里写自定义目录标题 逆向技巧断点一 、请求入口定位1. 关键字搜索2. 请求堆栈3. hook4. JSON.stringify 二、响应入口定位&#xff1a;1. 关键字搜索2. hook3. JSON.parse 逆向技巧 断点 普通断点 条件断点 日志断点 XHR断点 一 、请求入口定位 1. 关键字搜索 key关…

办公软件的答案?ONLYOFFICE 桌面应用编辑器会是最好用的 Office 软件?ONLYOFFICE 桌面编辑器使用初体验

文章目录 &#x1f4cb;前言&#x1f3af;什么是 ONLYOFFICE&#x1f3af; 主要功能介绍及 8.1 新功能体验&#x1f3af; 在线体验&#x1f4dd;最后 &#x1f4cb;前言 提到办公软件&#xff0c;大家最常用的可能就是微软的 Microsoft Office 和国产的 WPS Office。这两款软件…

jenkins环境搭建--关于jenkins在Ubuntu下的安装篇(一)

在ubuntu下使用命令进行下载安装包&#xff1a; 关于jenkins的安装有多种&#xff0c;可以借助docker容器进行安装&#xff0c;也可以通过传统方法手动一步步的进行安装&#xff0c;以下介绍手动一步步的安装方法&#xff0c;后续我们将解释关于jenkins的相关配置以及实战使用…

欧盟指控苹果应用商店规则非法压制竞争,面临巨额罚款风险

每周跟踪AI热点新闻动向和震撼发展 想要探索生成式人工智能的前沿进展吗&#xff1f;订阅我们的简报&#xff0c;深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同&#xff0c;从行业内部的深度分析和实用指南中受益。不要错过这个机会&#xff0c;成为AI领…

Excel 宏录制与VBA编程 —— 14、使用VBA处理Excel事件

简介 若希望特定事件处理程序在触发特定事件时运行&#xff0c;可以为 Application 对象编写事件处理程序。 Application 对象的事件处理程序是全局的&#xff0c;这意味着只要 Microsoft Excel 处于打开状态&#xff0c;事件处理程序将在发生相应的事件时运行&#xff0c;而不…

计算机网络 交换机的基本配置

一、理论知识 1.三种模式&#xff1a; ①用户模式&#xff1a;当登录路由器后&#xff0c;系统自动进入用户EXEC命令模式。 例如&#xff1a; Router> 在用户模式状态下&#xff0c;用户只能查看路由器的连接状态和基本信息&#xff0c;访问其他网络和主机&#xff0c…

数据库管理与数据库语句

数据库用户管理及高级sql语句 数据库管理 数据库用户管理 mysql权限表 在mysql中mysql库中的user表是最重要的权限表&#xff0c;记录允许连接到服务器的账号信息以及全局权限&#xff0c; 在mysql库中db和host表也是重要的权限表 db表中存储了用户对某个数据库的操作权限&…

DataGrip 2024 mac/win版:让数据库管理更简单

JetBrains DataGrip 2024 是一款专为数据库开发者设计的集成开发环境(IDE)&#xff0c;它凭借其卓越的性能和丰富的功能&#xff0c;为数据库管理提供了前所未有的便利。 DataGrip 2024 mac/win版获取 DataGrip 2024 支持几乎所有主流的关系型数据库管理系统&#xff0c;如 My…

浅谈目标检测之YOLO(You Only Look Once)v1

简介&#xff1a;本文章要介绍的YOLOv1算法&#xff0c;它与之前的目标检测算法如R-CNN等不同&#xff0c;R-NN等目标检测算法是一种两阶段&#xff08;two-stage&#xff09;算法&#xff0c;步骤为先在图片上生成候选框&#xff0c;然后利用分类器对这些候选框进行逐一的判断…

记录一下MATLAB优化器出现的问题和解决

今天MATLAB优化器出了点问题。我想了想&#xff0c;决定解决一下&#xff0c;不然后面项目没有办法进行下去。 我忘了截图了。 具体来说&#xff0c;是出现了下面的问题。 Gurobi: Cplex: 在上次为了强化学习调整了Pytoch环境以后&#xff08;不知道是不是这个原因&#…

仓库管理系统09--修改用户密码

1、添加窗体 2、窗体布局控件 UI设计这块还是传统的表格布局&#xff0c;采用5行2列 3、创建viewmodel 4、前台UI绑定viewmodel 这里要注意属性绑定和命令绑定及命令绑定时传递的参数 <Window x:Class"West.StoreMgr.Windows.EditPasswordWindow"xmlns"http…