【Python实战因果推断】1_因果效应异质性1

目录

From ATE to CATE

Why Prediction Is Not the Answer

CATE and ITE


本文将介绍应用于行业的因果推理中最有趣的发展:效应异质性。在此之前,你们了解的是一种治疗方法的一般影响。现在,你将专注于发现它如何对不同的人产生不同的影响。治疗效果并非恒定不变,这个想法很简单,但却非常强大。了解哪些单位对某种治疗的反应更好,是决定谁接受治疗的关键。效应异质性为个性化这一备受推崇的理念提供了一种因果推理方法。首先,您将从理论层面了解效应异质性,了解估计效应异质性的挑战是什么,以及如何扩展已学知识以应对这些挑战。接下来,您将看到效应异质性的估算与预测性研究密切相关。
异质性效应与预测问题密切相关,而预测问题对于数据科学家来说已经非常熟悉了。因此,您将看到交叉验证和模型选择的理念如何仍然适用于治疗异质性模型。然而,验证效果估计值比评估简单的预测模型更具挑战性,这就是为什么你会看到一些新颖的方法。
最后提供了一些如何使用效应异质性指导决策的指南和示例。虽然并非详尽无遗,但我希望这些示例能告诉您如何将这些想法用于解决自己的业务问题。

From ATE to CATE

到目前为止,你们每次估算治疗的因果影响时,大多都是平均治疗效果:

\tau=E\bigl[Y_1-Y_0\bigr]或者是等价的连续治疗\tau=E[y'(t)]y'(t)是治疗反应函数的导数。

也就是说,您已经学会了揭示治疗总体有效性的技术。ATE 估算是因果推理的基石。它是一个超级有用的工具,可用于决策问题,也就是所谓的项目评估:当你想知道是否应该在整个人群中推广一种治疗方法时。

现在,是时候学习如何为另一种类型的决策提供信息了:你应该对哪个单位进行治疗?为此,您需要允许决策从一个单位变为另一个单位。

例如,给某个客户提供折扣券可能是有益的,但不给另一个客户,因为某个客户可能对折扣更敏感。或者,将疫苗优先提供给某一群体而不是另一群体也是有道理的,因为这些群体会从这种待遇中获益更多。在这种情况下,个性化是关键。

实现个性化的一种方法是将效果异质性考虑在内,即估算条件平均治疗效果 (CATE)。通过考虑每个单位的独特特征,您可以确定针对该特定案例的最有效治疗方法:E\bigl[Y_1-Y_0\bigl|X\bigr] \mathrm{or} E\bigl[y'(t)\bigl|X\bigr]

以 X 为条件意味着,您现在允许治疗效果因每个单位的协变量 X 所定义的特征而异。同样,在这里,您认为并非所有单位都对治疗有同样好的反应,您希望利用这种异质性。您希望只对合适的单位进行治疗(在二元情况下),或者找出每个单位的最佳治疗剂量(在连续情况下)。

例如,如果您是一家银行,需要决定每位客户有资格获得的贷款额度,那么您可以肯定的是,向每个人发放大量资金并不是一个好主意,尽管这对某些人来说可能是合理的。你必须精明地处理(贷款额度)。也许,根据客户的信用评分,您可以找出合适的贷款额度。当然,您并不需要成为一家大型机构来利用个性化服务。我们不乏这样的例子。您应该在一年中的哪几天进行销售?产品价格应该是多少?每个人的运动量是多少?

Why Prediction Is Not the Answer

可以这样想。您有一群客户和一种处理方法(价格、折扣、贷款......),您想对处理方法进行个性化,例如,给不同的客户不同的折扣。假设您可以按结果图将客户组织成以下处理方式:

您可以将个性化任务视为客户细分问题。您要根据客户对您的处理方式的反应来创建客户群。例如,您想找到对折扣反应好的客户和对折扣反应差的客户。

那么,客户对处理方法的反应由条件处理效果 \frac{\delta Y}{\delta T} 给出。因此,如果您能以某种方式估算出每位顾客的条件处理效果,您就能将那些对处理效果好的顾客(高处理效果)和那些对处理效果差的顾客进行分组。如果能做到这一点,就能像下图一样分割客户空间:

这就太好了,因为现在你可以估算出每个组的不同治疗效果。同样,由于疗效只是治疗反应函数的斜率,如果你能得出斜率不同的组别,那么这些分区的实体对治疗的反应就会不同:

现在,将其与传统的机器学习方法进行对比。您可能会尝试预测 Y,而不是每个单元的导数 \frac{\delta Y}{\delta T}。假定你的预测模型能很好地逼近目标,这将从根本上分割 Y 轴上的空间。然而,这并不一定会导致各组具有不同的治疗效果。这就是为什么简单地预测结果并不总是对决策有用:

好吧,你可能会说,我知道我必须估计效果,而不仅仅是预测结果,但这有点棘手。如果我看不到斜率\frac{\delta Sales}{\delta Discount},我怎么能预测它呢?

说得好。与原始结果 Y 不同,斜率(或变化率)在单位层面上基本上是不可观测的。要想看到单个斜率,就必须观察每个单位在不同处理水平下的情况,并计算每个处理结果的变化情况

\frac{\delta Y_i}{\delta T_i}\approx\frac{Y(T_i)-Y(T_i+\epsilon)}{T_i-(T_i+\epsilon)}

这又是因果推论的根本问题。在不同的治疗条件下,你不可能看到相同的单位。那么,你能做什么呢?

CATE and ITE

请记住,CATE 不同于个体治疗效果(ITE)。例如,假设您有两组病人,x = 1 和 x = 2,每组 4 个单位,您想知道一种新药对一种疾病的治疗效果,这种疾病通常会导致 50%的患者死亡。
对于 x = 1 组,该药物对一名病人不利,导致其死亡,但却挽救了另一名病人。对于 x = 2 组,药物效果为零,其中 1 人死亡(请记住,这种疾病的致死率为 50%)。在这两组中,CATE 都是 0.5,但没有一个单位的 ITE 是 0.5。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/34237.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Java | Leetcode Java题解之第198题打家劫舍

题目&#xff1a; 题解&#xff1a; class Solution {public int rob(int[] nums) {if (nums null || nums.length 0) {return 0;}int length nums.length;if (length 1) {return nums[0];}int first nums[0], second Math.max(nums[0], nums[1]);for (int i 2; i <…

【Oracle篇】逻辑备份工具expdp(exp)/impdp(imp)和物理备份工具rman的区别和各自的使用场景总汇(第八篇,总共八篇)

&#x1f4ab;《博主介绍》&#xff1a;✨又是一天没白过&#xff0c;我是奈斯&#xff0c;DBA一名✨ &#x1f4ab;《擅长领域》&#xff1a;✌️擅长Oracle、MySQL、SQLserver、阿里云AnalyticDB for MySQL(分布式数据仓库)、Linux&#xff0c;也在扩展大数据方向的知识面✌️…

链表数组遍历输出的辨析(二者都含指针的情况下)----PTA期末复习题

输入输出三位学生的学号和信息 一开始我认为是指针&#xff0c;直接背了指针输出的方式&#xff1b;p;p!NULL;pp->next 这个是错误的 下面这个输出是正确的方式 分析怎么区分这两个 举个例子来 数组遍历&#xff1a; 链表遍历&#xff1a; 输出的结果&#xff1a; 如果将…

Android小技巧:利用动态代理自动切换线程

日常开发中&#xff0c;多线程编程是个难以避免的话题&#xff0c;开发者可以小心翼翼、谨慎地、严谨地编程来编写出高效的、安全的多线程程序&#xff0c;但是在长时间的维护中&#xff0c;难免因为其中某个人的某个疏忽而导致出现预料之外的并发问题&#xff0c;比如下面这个…

【XCharts插件】5-1、从Json中读取数据并更新图表案例(v3.0)

推荐阅读 CSDN主页GitHub开源地址Unity3D插件分享简书地址QQ群:398291828大家好,我是佛系工程师☆恬静的小魔龙☆,不定时更新Unity开发技巧,觉得有用记得一键三连哦。 一、前言 XCharts插件是一款基于UGUI的功能强大、易用、参数可配置的数据可视化图表插件。 【Unity3D…

区块链技术与数字货币

1.起源 ➢中本聪(Satoshi Nakamoto), 2008 ➢比特币:一种点对点的电子现金系统 2.分布式账本技术原理 1.两个核心技术&#xff1a; ➢以链式区块组织账本数据实现账本数据的不可篡改 ➢分布式的可信记账机制 2.共识机制&#xff1a;由谁记账 ➢目的&#xff1a; ⚫ 解…

【数据结构(邓俊辉)学习笔记】二叉搜索树03——平衡

文章目录 1. 极端退化2. 平均高度3. 理想 适度4. 歧义 等价5. 等价变换 1. 极端退化 二叉搜索树为我们同时实现对数据集高效的静态操作以及动态操作打开了一扇新的大门。 正如我们所看到的&#xff0c;从策略上&#xff0c;BST可以视作是试图将此前的向量结构以及列表结构优…

SpringBoot整合MongoDB JPA使用

一、整合MongoDB SpringDataMongoDB是 SpringData家族成员之一&#xff0c;MongoDB的持久层框架&#xff0c;底层封装了 mongodb-driver。mongodb-driver 是 MongoDB官方推出的 Java连接 MongoDB的驱动包&#xff0c;相当于JDBC驱动。 SpringBoot整合 MongoDB&#xff0c;引入…

jetson 安装 Rustdesk失败

报错: rustdesk depends on gstreamer1.0-pipewire; however: Package gstreamer1.0-pipewire is not installed. 原因&#xff1a; 对于rustdesk&#xff0c;其1.2.3 版需要gstreamer1.0-pipewire软件包&#xff0c;但是此软件包仅适用于 Ubuntu 22.04、22.10、23.04 和 2…

Python数据分析入门:探索数据集

在数据科学领域&#xff0c;Python以其简洁的语法和强大的库支持&#xff0c;成为最受欢迎的编程语言之一。无论是数据清洗、探索性数据分析还是复杂的机器学习任务&#xff0c;Python都能提供相应的工具。本文将引导你使用Python进行简单的数据分析&#xff0c;以一个公开的数…

C语言 用下面的scanf函数输入数据,使a=3,b=7,x=8.5,y=71.82,c1=‘A’,c2=‘a’。在键盘上应该如何输入?

用下面的scanf函数输入数据&#xff0c;使a3&#xff0c;b7&#xff0c;x8.5&#xff0c;y71.82&#xff0c;c1‘A’,c2‘a’。在键盘上应该如何输入&#xff1f; #include<stdio.h> int main() { int a&#xff0c;b&#xff1b; float x,y; char c1,c2; scanf(“…

k8s_如何修改k8s使用docker或者container作为容器运行时

如果 kubelet.conf 没有明确的容器运行时相关设置&#xff0c;并且你希望配置 Kubernetes 使用 Docker 或 containerd 作为容器运行时&#xff0c;可以通过以下步骤进行配置。具体的配置步骤如下&#xff1a; 配置 Kubernetes 使用 Docker 作为容器运行时 确保 Docker 已安装并…

js中的浅拷贝和深拷贝

浅拷贝Shallow Copy 浅拷贝只复制对象的顶层属性及其引用&#xff0c;而不复制这些引用所指向的对象。如果原始对象中的某个属性是一个对象或数组&#xff0c;那么浅拷贝后的对象将包含对这个内部对象或数组的引用&#xff0c;而不是这个对象或数组的一个新副本。 let obj1 …

【Mac】XnViewMP for Mac(图片浏览查看器)及同类型软件介绍

软件介绍 XnViewMP 是一款多功能、跨平台的图像查看和管理软件&#xff0c;适用于 macOS、Windows 和 Linux 系统。它是经典 XnView 软件的增强版本&#xff0c;更加现代化且功能更强大。XnViewMP 支持数百种图像格式&#xff0c;并提供多种图像处理工具&#xff0c;使其成为摄…

【摄像头标定】使用kalibr进行双目摄像头标定(ros1、ros2)

使用kalibr进行双目摄像头标定 前言标定板标定①板端准备和录制②上位机准备和标定 前言 本文不是纯用ros1进行标定&#xff0c;需要ros1和ros2通信。给使用ros2进行开发&#xff0c;但又想用kalibr标定双目摄像头的小伙伴一个教程。本文双目摄像头的数据发布使用ros2&#xf…

认识Unity中的音效

一、Audio Clip&#xff1a;音频片段 一个AudioClip对象存储了一段声音&#xff0c;可用于播放音效、背景音乐和语音对白等 ambisonic参数指示该音频片段是否是立体混响声 二、Audio Source&#xff1a;音源 用于在场景中播放AudioClip ——相当于发出声音的物体或设备。…

网络安全实战,潜伏与Python反向连接

注意:本文的下载教程,与以下文章的思路有相同点,也有不同点,最终目标只是让读者从多维度去熟练掌握本知识点。 下载教程: Python网络安全项目开发实战_潜伏与Python反向连接_编程案例解析实例详解课程教程.pdf 在网络安全领域,潜伏与反向连接技术常被黑客用于绕过防火墙和…

收银系统源码-千呼新零售2.0【线上营销】

千呼新零售2.0系统是零售行业连锁店一体化收银系统&#xff0c;包括线下收银线上商城连锁店管理ERP管理商品管理供应商管理会员营销等功能为一体&#xff0c;线上线下数据全部打通。 适用于商超、便利店、水果、生鲜、母婴、服装、零食、百货等连锁店使用。 详细介绍请查看&a…

Js逆向爬虫基础篇

这里写自定义目录标题 逆向技巧断点一 、请求入口定位1. 关键字搜索2. 请求堆栈3. hook4. JSON.stringify 二、响应入口定位&#xff1a;1. 关键字搜索2. hook3. JSON.parse 逆向技巧 断点 普通断点 条件断点 日志断点 XHR断点 一 、请求入口定位 1. 关键字搜索 key关…

办公软件的答案?ONLYOFFICE 桌面应用编辑器会是最好用的 Office 软件?ONLYOFFICE 桌面编辑器使用初体验

文章目录 &#x1f4cb;前言&#x1f3af;什么是 ONLYOFFICE&#x1f3af; 主要功能介绍及 8.1 新功能体验&#x1f3af; 在线体验&#x1f4dd;最后 &#x1f4cb;前言 提到办公软件&#xff0c;大家最常用的可能就是微软的 Microsoft Office 和国产的 WPS Office。这两款软件…