【Python实战因果推断】60_随机实验与统计知识2

目录

An A/B Testing Example


An A/B Testing Example

在许多公司中,一种常见的策略是提供廉价甚至免费的产品,这种产品本身可能并不盈利,但其目的是吸引新客户。一旦公司获得了这些客户,就可以向他们推销其他更盈利的产品,这一过程被称为交叉销售。假设你在一个咖啡配送公司工作,公司的主打产品是一种低成本的月度订阅服务,允许客户每周收到高质量、精心挑选的咖啡。除了这个基本且成本较低的订阅服务外,公司还提供一种更高端的订阅服务,包含优质的冲泡体验以及来自世界各地的顶级咖啡,例如巴西小镇Divinolandia的本地生产者提供的咖啡。这是公司最赚钱的服务,因此你的目标是增加向已经订阅了低成本入门产品的用户销售这项高端服务的数量。为此,公司有一个营销团队,主要通过发送交叉销售邮件来推销高端咖啡订阅服务。

作为因果推断专家,你的任务是评估这些邮件的有效性。当你查看现有的(非随机化)数据以回答这个问题时,可以明显看到收到邮件的客户更有可能购买高端订阅服务。在技术术语中,当客户购买你正在推销的产品时,可以说他们转化了。因此,可以说收到邮件的客户转化率更高:

E[Conversion|Email=1]>E[Conversion|Email=0]

不幸的是,你还发现营销团队倾向于向那些他们认为一开始更有可能转化的客户发送邮件。具体他们是如何做到这一点的并不完全清楚。也许他们寻找与公司互动最多的客户,或者是在满意度调查中给予积极反馈的客户。无论如何,这是一个强烈的信号,表明即使不发送邮件,

E\big[Conversion_0\big|Email=1\big]>E\big[Conversion_0\big|Email=0\big].

换句话说,即使不发送任何邮件,实际上被发送了邮件的客户群体会比其他客户群体有更高的转化率。因此,简单的平均值比较是无法准确估计交叉销售邮件的真实因果效应的,因为这样的比较是有偏见的。为了解决这个问题,你需要让接受处理和未接受处理的两组客户变得可比:

E\bigl[Y_{0}\bigr|T=1\bigr]=E\bigl[Y_{0}\bigr|T=0\bigr]

这可以通过随机分配邮件来实现。如果你成功做到了这一点,那么平均而言,接受处理和未接受处理的两组客户除了受到的处理(即是否发送邮件)之外,在转化率上应该是相同的。于是,假设你确实这样做了。你从客户基础中随机选择了三个样本。对其中一个样本,你没有发送任何邮件;对另一个样本,你发送了一封内容丰富、精心撰写的关于高端订阅的邮件;对最后一个样本,你发送了一封简短而直接的关于高端订阅的邮件。收集了一段时间的数据后,你得到了以下的结果:

 import pandas as pd # for data manipulationimport numpy as np # for numerical computationdata = pd.read_csv("./data/cross_sell_email.csv")data

你看到总共有323个观测值。虽然算不上大数据,但已经足够进行分析了。

为了估计因果效应,你只需简单计算每个处理组的平均转化率:

 (data.groupby(["cross_sell_email"]).mean())

确实就是这么简单。你可以看到,没有收到邮件的那组客户转化率为4.2%,而分别收到长邮件和短邮件的两组客户的转化率分别为5.5%和惊人的12.5%。因此,平均治疗效应(ATE),即每个治疗组与控制组之间的差异,计算公式为: ATE=E[Y|T=t]-E[Y|T=0], 对于长邮件和短邮件组,分别提高了1.3和8.3个百分点。

有趣的是,发送简洁明了的邮件似乎比精心编排的长邮件效果更好。

RCT(随机对照试验)的美妙之处在于,你不再需要担心营销团队是否以某种方式针对了可能转化的客户,也不必担心来自不同治疗组的客户在系统上存在任何差异,除了他们所接受的治疗外。按设计,随机实验旨在消除这些差异,使 Y0 和 Y1 在 T 上保持独立,至少理论上如此。

实践中,一个合理的检查方法是看随机化是否正确执行(或者你是否查看了正确的数据),即检查治疗前变量中治疗组与非治疗组是否相等。例如,你有性别和年龄的数据,可以查看这两个特征在各治疗组之间是否均衡。

当你查看年龄时,治疗组看起来非常相似,但在性别方面似乎存在差异(女性=1,男性=0)。收到短邮件的组别中,男性占比达到63%,相比之下,控制组和长邮件组的男性比例分别为54%和55%。这让人有些不安,因为你在转化效果最大的治疗组中发现了这种差异。即便在理论上RCT应该保证独立性,但实际上并不一定成立。你看到的短邮件产生大效果可能是因为某种原因,男性客户的基础转化率 E[Y0|man] 大于女性客户 E[Y0|woman]。

评价平衡性并没有明确的共识,但一个简单的建议是检查治疗组之间的标准化差异:\frac{\hat{\mu}_{tr}-\hat{\mu}_{co}}{\sqrt{\left(\hat{\sigma}_{tr}^{2}+\hat{\sigma}_{co}^{2}\right)/2}},

其中 μ 和 σ^2 分别代表样本均值和方差。由于你的例子中有三个治疗组,你只需计算相对于控制组的这个差异:

 X = ["gender", "age"]mu = data.groupby("cross_sell_email")[X].mean()var = data.groupby("cross_sell_email")[X].var()norm_diff = ((mu - mu.loc["no_email"])/np.sqrt((var + var.loc["no_email"])/2))norm_diff

如果这个差异太小或太大,你应该感到担忧。遗憾的是,没有一个明确的阈值来界定多大的差异是过多的,但0.5似乎是一个不错的经验法则。在这个例子中,你没有任何差异达到这么高的水平,但是短邮件组在性别上的差异较大,而长邮件组在年龄上的差异较大。

如果上述公式现在看来有些神奇,不必担心。一旦你复习完统计学部分,它会变得更清晰。现在,我只想提醒你注意小数据集下可能发生的情况。即使在随机化下,也有可能某个组由于偶然性与另一组不同。在大样本中,这种差异往往趋于消失。这也引出了一个议题:多大的差异足以让你得出结论,即治疗确实是有效的,而不仅仅是因为偶然性,这是接下来我将要讨论的内容

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/876421.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

ThinkPHP一对一关联模型的运用(ORM)

一、序言 最近在写ThinkPHP关联模型的时候一些用法总忘,我就想通过写博客的方式复习和整理下一些用法。 具体版本: topthink/framework:6.1.4topthink/think-orm:2.0.61 二、实例应用 1、一对一关联 1.1、我先设计了两张表&#x…

[SWPU2019]Web1

上来看到两个功能,登录和注册,看到登录框直接sqlmap嗦一下 失败 注册admin显示被注册,那就注册一个账密都为aaa 登录进来发现两个功能点 发了一个广告却显示代管理确认,这里肯定没有管理员,所以我们得想办法自己上去a…

铲屎官的必备好物——希喂、352、米家养宠空气净化器分享

对于每一位深爱着家中萌宠的铲屎官而言,无尽的温情往往也伴随着日常生活中的小烦恼。那些不经意间飘散在空气中的毛发,偶尔缠绕在鼻腔或口腔中的细微触感,以及偶尔袭来的不明异味,都是与宠物共度的日子里不可或缺的一部分。幸好随…

聊聊RNNLSTM

RNN 用于解决输入数据为,序列到序列(时间序列)数据,不能在传统的前馈神经网络(FNN)很好应用的问题。时间序列数据是指在不同时间点上收集到的数据,这类数据反映了某一事物、现象等随时间的变化状态或程度,即输入内容的上下文关联…

基于Orangepi全志H616开发嵌入式数据库——SQLite

目录 一、SQLite数据库 1.1 SQLite 的特点: 1.2 SQLite 的使用场景: 1.3 SQLite数据库与传统MySQL数据库的区别: 二、SQLite数据库安装 2.1 SQLite数据库安装方式一: 2.2 SQlite数据库安装方式二: 三、SQLite数…

Nacos适配达梦数据库并制作镜像

背景:因项目需要信创,需将原本的mysql数据库,改成达梦数据库 一、部署达梦数据库 1.1 部署达梦数据库服务 可参考:Docker安装达梦数据库_达梦数据库docker镜像-CSDN博客 1.2 创建nacos数据库 create user SAFE_NACOS identifi…

放大电路总结

补充: 只有直流移动时才有Rbe动态等效电阻 从RsUs看进去,实际上不管接了什么东西都能够看成是一个Ri(输入电阻) Ri Ui/Ii Rb//Rbe Ui/Us Ri/(RiRs) Aus (Uo/Ui)*(Ui/Us) Au *Ri/(RiRs) 当前面是一个电压源的信号 我们就需要输入电阻更大 Ro--->输出电阻--->将…

VSCode+git的gitee仓库搭建

​ 在此之前你已经在gitee创建好了账号,并新建了一个仓库。 1. 安装 Visual Studio Code Visual Studio Code 是编辑 Markdown 和站点配置文件的基础,以下将其简称为 VSCode,你可以在它的 官方网站 下载到它。 如若不理解各个版本之间的区别…

【C++ —— 用一棵红黑树同时封装出map和set】

C —— 用一棵红黑树同时封装出map和set 总览RBTreeMyMapMySet 红黑树源代码红黑树模板参数的控制模板参数中仿函数的增加迭代器模拟1. 迭代器的定义和结构2. 迭代器的操作符重载 set模拟map模拟代码红黑树的代码set的代码map的代码 总览 RBTree enum Colour {RED,BLACK };//…

算法板子:Trie树——存储字符串、查找字符串的出现次数

#include <iostream> using namespace std;const int N 1e6 10;// Trie树是一个集合&#xff0c;可以存储字符串 // son二维数组中&#xff0c;每行代表一个节点&#xff0c;该行的每列都是它的儿子&#xff0c;最多26列代表一个节点最多26个儿子(题目中说了都是小写字…

photoshop学习笔记——选区3

从窗口面板可以打开历史记录面板&#xff0c;历史记录面板保存了所有的操作 可以点击历史记录中某一条&#xff0c;回到当时的操作状态&#xff0c;也可以通过编辑中的 还原、重做、切换到最终状态逐步调整或直接跳到最终状态 回退之后&#xff0c;如果有新的操作&#xff0c;历…

WordPress文章标题定制化前缀插件

引言 在当今互联网的海洋中&#xff0c;吸引读者眼球的第一步往往始于文章标题的设计。对于WordPress博主而言&#xff0c;如何让每篇文章的标题更加个性化和吸引人&#xff0c;成为了一项重要的任务。传统的自定义CSS方法虽然可行&#xff0c;但其繁琐的操作和有限的美学效果…

【高校科研前沿】浙江农林大学童再康教授等人在农林科学顶刊《CATENA》发文:长期覆盖作物可促进多养分循环和地下土壤碳封存

文章简介 论文名称&#xff1a;Long-term cover crops boost multi-nutrient cycling and subsurface soil carbon sequestration by alleviating microbial carbon limitation in a subtropical forest&#xff08;长期覆盖作物通过缓解亚热带森林中微生物的碳限制&#xff0c…

常见的jmeter面试题及答案

1、解释什么是JMeter? JMeter是一款Java开源工具&#xff0c; 用于性能负载测试。它旨在分析和衡量Web应用程序和各种服务的性能和负载功能行为。 2、说明JMeter的工作原理? JMeter就像一群将请求发送到目标服务器的用户-样。它收集来自目标服务器的响应以及其他统计数据&…

每日OJ_牛客_HJ91 走方格的方案数

目录 牛客HJ91 走方格的方案数 解析代码 牛客HJ91 走方格的方案数 走方格的方案数_牛客题霸_牛客网 解析代码 本题为求取路径总数的题目&#xff0c;一般可以通过递归求解&#xff0c;对于复杂的问题&#xff0c;可以通过动态规划求解。此题比较简单&#xff0c;也可以通过递…

Vue2和Vue3实战代码中的小差异(实时更新)

目录 前言1. 未使用自闭合标签2. 事件名连字符3. 换行符4. 弃用.sync 前言 以下文章实时更新&#xff0c;主打记录差异 1. 未使用自闭合标签 104:7 error Require self-closing on Vue.js custom components (<el-table-column>) vue/html-self-closing✖ 1 problem…

Logback 快速入门

一、简介 Java 开源日志框架&#xff0c;以继承改善 log4j 为目的而生&#xff0c;是 log4j 创始人 Ceki Glc 的开源产品。 它声称有极佳的性能&#xff0c;占用空间更小&#xff0c;且提供其他日志系统缺失但很有用的特性。 其一大特色是&#xff0c;在 logback-classic 中本…

大模型算法备案流程最详细说明【流程+附件】

文章目录 一、语料安全评估 二、黑盒测试 三、模型安全措施评估 四、性能评估 五、性能评估 六、安全性评估 七、可解释性评估 八、法律和合规性评估 九、应急管理措施 十、材料准备 十一、【线下流程】大模型备案线下详细步骤说明 十二、【线上流程】算法备案填报…

QT vs2019编译报错LNK2019无法解析的外部符号

严重性 代码 说明 项目 文件 行 禁止显示状态 错误 LNK2019 无法解析的外部符号 "public: __cdecl Dialog_Setting::Dialog_Setting(class QWidget *)" (??0Dialog_SettingQEAAPEAVQWidgetZ)&#xff0c;函数 "public: __cdecl QtWid…

工业现场实测,焦化厂导烟车与装煤车风机实现无人作业

一、项目背景 作为我国重要的能源行业之一&#xff0c;焦化行业在国民经济中扮演着重要角色&#xff0c;焦化工艺是高温、高压、有毒物质等因素共同作用下进行的&#xff0c;因此存在着安全隐患&#xff0c;并伴有环境污染&#xff0c;改善焦化工艺的安全和环保问题是当前亟待…