【Python实战因果推断】56_因果推理概论6

目录

Causal Quantities: An Example

Bias


Causal Quantities: An Example

让我们看看在我们的商业问题中,你如何定义这些量。首先,你要注意到,你永远无法知道价格削减(即促销活动)对某个特定商家的确切影响,因为这需要你同时看到两种可能的结果:没有促销时的销售额AmountSold0i与促销后的销售额AmountSold1i。但是,你却可以将焦点放在一些可估算的事情上,比如价格削减对销售额的平均影响:

ATE=E\big[AmountSold_{1i}-AmountSold_{0i}\big],

或是参与价格削减的商家如何增加了它们的销售量:

ATT=E\big[AmountSold_{1i}-AmountSold_{0i}\big|IsOnSales=1\big],

又或是圣诞节那一周进行促销活动的影响:

CATE=E\big[AmountSold_{1i}-AmountSold_{0i}\big|weeksToXmas=0\big]

现在,我明白你无法同时看到两个可能的结果,但为了论证的目的,也为了让事情变得更为具体,我们假设你能够。想象一下,因果推断的神明对你在众多统计战役中的英勇表现感到满意,因而赐予你神力,使你能看到潜在的替代宇宙——在其中一个宇宙里,每种结果都已发生。凭借这股力量,你说你收集了六个商家的数据,其中三个商家正在进行促销,而另外三个则没有。

在下表中,i是单位标识符,y是观察到的结果,y0和y1分别是控制组和处理组的潜在结果,t是处理指示符,x是标记距离圣诞节还有多少周的协变量。请记住,进行促销是处理,销售金额是结果。我们同样假设在这六个商家中,你从两个商家那里收集到了圣诞节前一周的数据,这通过x=1来表示;而其余的数据则来自圣诞节当周:

你可能会看着这个数据思考,“这当然不理想,但我不能仅仅取处理组的平均值,然后与未处理组的平均值进行比较吗?换句话说,我不能直接做ATE = (500 + 600 + 800) / 3 - (200 + 120 + 300) / 3 = 426.67吗?”不可以! 你刚刚犯下了将关联误认为因果关系的严重错误!

注意结果的差异有多大。你之前计算的ATE不到100,而现在你却说它是超过400。问题在于,参与促销活动的商家与未参与的商家不同。事实上,即使不降价,参与促销的商家也可能卖出更多的商品。为了证明这一点,只需回顾一下你能看到两种潜在结果的情况。那时,处理组的Y0比未处理组高得多。处理组之间Y0的这种差异使得仅通过比较两组来揭示处理效应变得更加困难。

尽管比较平均值并不是最明智的想法,但我认为你的直觉方向是正确的。现在是时候应用你刚学到的新概念来精炼这一直觉,最终理解为什么关联并不等于因果。是时候面对因果推断的主要敌人了。

Bias

直截了当地说,偏差是让关联与因果产生区别的原因。你在数据中估计的量与你想恢复的因果量不符,这才是问题所在。幸运的是,通过一些直观理解,这个问题很容易被把握。让我们回顾一下商业案例。当你面对“降价能增加商家销售量”的说法时,你可以质疑它,指出那些进行促销的商家即使没有降价,可能也会卖出更多的商品。也许这是因为它们规模更大,有能力实施更具侵略性的促销策略。换句话说,进行促销的商家(即被处理的商家)与未进行促销的商家(即未被处理的商家)不具备可比性。

为了给出更正式的论证,你可以使用潜在结果符号来转化这一直观认识。首先,为了估计ATE,你需要估计如果被处理者没有接受处理会发生什么,即E[Y0|T=1],以及如果未被处理者接受了处理会发生什么,即E[Y1|T=0]。当你比较被处理者和未被处理者的平均结果时,你实际上是在用E[Y|T=0]来估计E[Y0],并用E[Y|T=1]来估计E[Y1]。换句话说,你是在试图通过E[Y|T=t]来恢复E[Yt]。如果两者不匹配,那么像E[Y|T=t]这样的估计器,比如接受处理t的那些个体的平均结果,就会成为E[Yt]的有偏估计。

回归直观理解,你甚至可以利用你对世界运作方式的理解来进一步分析。你可以指出,被处理商家的Y0可能比未处理商家的Y0要大。这是因为有能力进行价格削减的商家,无论是否有价格削减,其销售量往往更高。请花一点时间来消化这个观点。习惯于谈论潜在结果需要一段时间,因为它涉及到推理那些可能发生但并未发生的事件。请再次阅读这一段落,确保你理解了它。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/50065.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

AMEsim液压阀伯德图绘制方法

之前也在液压圈论坛里面发过类似的贴子,具体可以看这个网址🚪👉:如何得出说明书里面的伯德图曲线?,回复的人还是比较少,这个方法重要信息是参考百度文库这篇文章🚪👉&…

【系统架构设计师】计算机组成与体系结构 ⑯ ( 奇偶校验码 | CRC 循环冗余码 | 海明码 | 模 2 除法 )

文章目录 一、校验码1、校验码由来2、奇偶校验码3、CRC 循环冗余码 ( 重点考点 )4、海明码校验 ( 软考不经常考到 ) 二、CRC 循环冗余码 ( 重点考点 )1、模 2 除法概念2、模 2 除法步骤3、模 2 除法示例4、CRC 循环冗余码示例 15、CRC 循环冗余码示例 2 参考之前的博客 : 【计…

Webshell管理工具:AntSword(中国蚁剑)

中国蚁剑是一款开源的跨平台网站管理工具,它主要面向于合法授权的渗透测试安全人员以及进行常规操作的网站管理员。 通俗的讲:中国蚁剑是 一 款比菜刀还牛的shell控制端软件。 一、中国蚁剑下载 1. 下载 AntSword-Loader https://github.com/AntSwordP…

面试前端实习常问的关于【ES6新特性】的问题

ES6新特性 日常前端代码开发中,有哪些值得用 ES6 去改进的编程优化或者规范? 常用箭头函数来取代有this指向的函数常用 let 取代 var 命令常用数组/对象的结构赋值来命名变量(结构更清晰,语义更明确,可读性更好)在长字…

【C语言报错已解决】“Undefined Reference”

🎬 鸽芷咕:个人主页 🔥 个人专栏: 《C干货基地》《粉丝福利》 ⛺️生活的理想,就是为了理想的生活! 引言: 在开发过程中,我们经常会遇到各种编译错误或运行时错误。其中,“Undefined Referenc…

Axure Web端元件库:从Quick UI到500+组件的飞跃

在快速变化的数字世界中,产品设计不仅仅是功能的堆砌,更是用户体验的精心雕琢。原型设计作为产品开发过程中的关键环节,其重要性不言而喻。Axure,作为业界领先的原型设计工具,凭借其强大的交互设计和丰富的功能&#x…

Rce漏洞复习(ctfshow29-50)

Rce漏洞简介思维导图 Web29 代码审计: if(!preg_match("/flag/i", $c)){ eval($c); 传参没有flag(大小写都没有出现) Payload: ?csystem("ls"); ?csystem("tac *lag.php"); Web30 代码…

文件上传漏洞(ctfshow web151-161)

Web151 F12修改源代码 exts后面png改为php 这样就可以上传php的文件了 Web152: 考点:后端不能单一校验 就是要传图片格式,抓个包传个png的图片 然后bp抓包修改php后缀解析 然后放包 Web153-web156 在php代码中可以使用“{}”代替“[]” …

WPF项目实战视频《二》(主要为prism框架)

14.prism框架知识(1) 使用在多个平台的MVVM框架 新建WPF项目prismDemo 项目中:工具-NuGet包管理:安装Prism.DryIoc框架 在git中能看Prism的结构和源代码:git链接地址 例如:Prism/src/Wpf/Prism.DryIoc.Wpf…

机器学习 | 回归算法原理——随机梯度下降法

Hi,大家好,我是半亩花海。接着上次的多重回归继续更新《白话机器学习的数学》这本书的学习笔记,在此分享随机梯度下降法这一回归算法原理。本章的回归算法原理还是基于《基于广告费预测点击量》项目,欢迎大家交流学习!…

uniapp中出现图片过小会与盒子偏离

结论&#xff1a;在image的父盒子中加上display: flex&#xff0c;原因不清楚 出问题的代码和图片如下&#xff1a; <template><view style" background-color: greenyellow; height: 10rpx;width: 10rpx;"><image :src"imgSrc.seatnull" …

嵌入式C++、MQTT、数据库、Grafana、机器学习( Scikit-learn):智能建筑大数据管理平台(代码示例)

项目概述 智能建筑管理系统&#xff08;Intelligent Building Management System, IBMS&#xff09;是一个集成多种技术的复杂系统&#xff0c;旨在通过智能化手段提升建筑的管理效率、节能效果和居住舒适度。该系统涉及嵌入式系统、物联网&#xff08;IoT&#xff09;、大数据…

光明乳业:以科技赋能品质,引领乳业绿色新未来

近日&#xff0c;光明乳业再次成为行业焦点&#xff0c;其在科技创新与绿色发展方面的卓越表现赢得了广泛赞誉。作为中国乳制品行业的领军企业&#xff0c;光明乳业始终坚守品质至上的原则&#xff0c;不断探索科技创新之路&#xff0c;致力于为消费者提供更高品质、更健康的乳…

vdb:虚拟数据库

将文件虚拟成数据库&#xff0c;序列化写入、反序列化读取、直接读取。

Adobe正通过数字体验改变世界

在当今这个数字化飞速发展的时代&#xff0c;Adobe公司正以其创新的技术和卓越的产品引领着创意设计领域的变革。从Adobe发布的生成式AI工具&#xff08;Adobe Firefly&#xff09;&#xff0c;到Illustrator和Photoshop的新AI功能&#xff0c;再到广受认可的Adobe国际认证&…

GLSL教程 第5章:光照和材质

目录 5.1 光照模型基础 5.2 Phong光照模型 5.3 Blinn-Phong光照模型 5.4 Cook-Torrance光照模型 5.5 Lambert光照模型 5.6 材质属性的深入讲解 小结 光照和材质是计算机图形学中至关重要的元素&#xff0c;它们共同决定了渲染图像的视觉效果。光照模型用于模拟光源与物体…

政安晨【零基础玩转各类开源AI项目】基于Ubuntu系统部署LivePortrait :通过缝合和重定向控制实现高效的肖像动画制作

目录 项目论文介绍 论文中实际开展的工作 非扩散性的肖像动画 基于扩散的肖像动画 方法论 基于Ubuntu的部署实践开始 1. 克隆代码并准备环境 2. 下载预训练权重 3. 推理 快速上手 驱动视频自动裁剪 运动模板制作 4. Gradio 界面 5. 推理速度评估 社区资源 政安…

electron安装及快速创建

electron安装及快速创建 electron是一个使用 JavaScript、HTML 和 CSS 构建桌面应用程序的框架。 详细内容见官网&#xff1a;https://www.electronjs.org/zh/docs/latest/。 今天来记录下练习中的安装过程和hello world的创建。 创建项目文件夹&#xff0c;并执行npm 初始化命…

迅雷强制升级,漠视用户权力

用着迅雷&#xff0c;突然闪退&#xff0c;弹出升级界面。没有任何经过我的同意和操作&#xff0c;直接退出&#xff0c;强制升级。非常的蛮横和强硬。 升级完成之后&#xff0c;弹出一个提示框&#xff0c;提示框里有一个启动按钮&#xff0c;和一个加入开机自启的勾选框。意…

【Python实战】Google Chrome的离线小恐龙游戏

文章目录 Google Chrome的离线小恐龙游戏项目结构大纲 &#x1f4ca;&#x1f463;逐步编码过程 &#x1f9e9;&#x1f4a1;第一步&#xff1a;项目初始化与主程序框架第二步&#xff1a;实现T-Rex的跳跃功能第三步&#xff1a;添加障碍物和碰撞检测第四步&#xff1a;添加得分…