【初识扫盲】逆概率加权

我们正在处理一个存在缺失数据的回归模型,并且希望采用一种非参数的逆概率加权方法来调整估计,以应对这种缺失数据的情况。

首先,我们需要明确问题的背景。我们有样本 { ( Y i , X i , r i ) : i = 1 , … , n } \left\{\left(Y_i, \boldsymbol{X}_i, r_i\right): i=1, \ldots, n\right\} {(Yi,Xi,ri):i=1,,n},其中 Y i Y_i Yi 是因变量, X i \boldsymbol{X}_i Xi 是自变量,而 r i r_i ri 是一个指示变量:如果 Y i Y_i Yi 被观测到,则 r i = 1 r_i = 1 ri=1,否则 r i = 0 r_i = 0 ri=0。缺失机制是随机的,即 r i r_i ri 以概率 π i = π ( X i ) \pi_i = \pi(\boldsymbol{X}_i) πi=π(Xi) 服从伯努利分布,且与 X i \boldsymbol{X}_i Xi 独立。

关键在于,如果我们只使用完全数据(即 r i = 1 r_i = 1 ri=1 的数据),估计结果可能会有偏差,因为缺失数据并不是完全随机的。为了纠正这一点,我们采用逆概率加权法,通过加权来平衡观测数据,以反映整个数据集的情况。

目标函数被修改为:

β ^ h = arg ⁡ min ⁡ β ∈ R p ∑ i = 1 n r i π ( X i ) M \hat{\boldsymbol{\beta}}_h = \arg \min_{\boldsymbol{\beta} \in \mathbb{R}^p} \sum_{i=1}^n \frac{r_i}{\pi\left(\boldsymbol{X}_i\right)} M β^h=argβRpmini=1nπ(Xi)riM

让我们逐步解析这个目标函数。

  1. 逆概率加权:项 r i π i \frac{r_i}{\pi_i} πiri 是逆概率加权的关键。它通过除以观测概率 π i \pi_i πi 来加权每个观测数据点。这样做的目的是,那些更有可能被观测到的数据点会被赋予更高的权重,从而在估计过程中得到更多的关注。这有助于纠正由于缺失数据引入的偏差。

  2. 函数 M M M:一个目标函数

  3. 目标函数:整个目标函数是在所有样本上最小化加权和。即使某些 Y i Y_i Yi 缺失,我们也会对所有样本进行求和,但只有当 r i = 1 r_i = 1 ri=1 时,即 Y i Y_i Yi 被观测到时,才会对求和有贡献。

  4. 期望条件:提到的期望条件 E { r i π i − 1 ∣ X i } = 0 E\left\{\left.\frac{r_i}{\pi_i} - 1 \right| \boldsymbol{X}_i\right\} = 0 E{πiri1 Xi}=0 表明,逆概率加权调整在给定 X i \boldsymbol{X}_i Xi 的情况下,平均而言是无偏的。这是因为:

E { r i π i ∣ X i } = E ( r i ∣ X i ) π i = π i π i = 1 E\left\{\frac{r_i}{\pi_i} \mid \boldsymbol{X}_i\right\} = \frac{E(r_i \mid \boldsymbol{X}_i)}{\pi_i} = \frac{\pi_i}{\pi_i} = 1 E{πiriXi}=πiE(riXi)=πiπi=1

因此, E { r i π i − 1 ∣ X i } = 0 E\left\{\frac{r_i}{\pi_i} - 1 \mid \boldsymbol{X}_i\right\} = 0 E{πiri1Xi}=0,这意味着加权项在给定 X i \boldsymbol{X}_i Xi 的情况下,平均而言是中性的,从而有助于无偏估计。

这描述了如何通过逆概率加权法调整回归的目标函数,以处理缺失数据。通过为每个观测数据点分配一个与其观测概率成反比的权重,我们确保估计结果不会因数据缺失机制而产生偏差。

这种方法特别有用,因为它允许我们在不完全排除缺失数据的情况下,有效地利用所有可用数据,从而提高估计的效率和可靠性。

该目标函数通过逆概率加权法调整回归,以处理缺失数据,确保估计结果无偏且高效。 \boxed{ \text{该目标函数通过逆概率加权法调整回归,以处理缺失数据,确保估计结果无偏且高效。} } 该目标函数通过逆概率加权法调整回归,以处理缺失数据,确保估计结果无偏且高效。

这里提到的随机缺失是什么意思?详细解释一下这里的逆概率加权是什么意思,为什么期望是那样的?

我们来详细理解一下“随机缺失”和“逆概率加权”这两个概念,以及为什么在给定 X i \boldsymbol{X}_i Xi的情况下,期望 E { r i π i − 1 ∣ X i } = 0 E\left\{\left.\frac{r_i}{\pi_i} - 1 \right| \boldsymbol{X}_i\right\} = 0 E{πiri1 Xi}=0

首先,随机缺失(Missing at Random, MAR) 是指数据的缺失机制与未观测到的数据无关,但可能与已观测到的数据相关。换句话说,给定已观测到的变量 X i \boldsymbol{X}_i Xi,数据是否缺失仅取决于 X i \boldsymbol{X}_i Xi,而不取决于未观测到的 Y i Y_i Yi。这一假设非常重要,因为它允许我们使用已观测到的信息来调整缺失数据的影响,从而减少估计偏差。

接下来,逆概率加权(Inverse Probability Weighting, IPW) 是一种处理缺失数据的方法,通过为每个观测到的数据点分配一个权重,这个权重是其被观测到的概率的倒数。具体来说,如果一个数据点被观测到的概率是 π i \pi_i πi,那么它的权重就是 1 π i \frac{1}{\pi_i} πi1。这样做的目的是使每个数据点在分析中的权重与其被观测到的概率成反比,从而平衡观测数据,使其更具代表性。

现在,我们来探讨为什么在给定 X i \boldsymbol{X}_i Xi的情况下,期望 E { r i π i − 1 ∣ X i } = 0 E\left\{\left.\frac{r_i}{\pi_i} - 1 \right| \boldsymbol{X}_i\right\} = 0 E{πiri1 Xi}=0。我们逐步分析如下:

E { r i π i − 1 ∣ X i } = E { r i π i ∣ X i } − E { 1 ∣ X i } E\left\{\left.\frac{r_i}{\pi_i} - 1 \right| \boldsymbol{X}_i\right\} = E\left\{\left.\frac{r_i}{\pi_i} \right| \boldsymbol{X}_i\right\} - E\left\{1 \mid \boldsymbol{X}_i\right\} E{πiri1 Xi}=E{πiri Xi}E{1Xi}

由于 E { 1 ∣ X i } = 1 E\left\{1 \mid \boldsymbol{X}_i\right\} = 1 E{1Xi}=1,我们只需计算 E { r i π i ∣ X i } E\left\{\left.\frac{r_i}{\pi_i} \right| \boldsymbol{X}_i\right\} E{πiri Xi}

根据随机缺失假设, r i r_i ri在给定 X i \boldsymbol{X}_i Xi的条件下服从伯努利分布,即 r i ∣ X i ∼ B ( π i ) r_i \mid \boldsymbol{X}_i \sim \text{B}(\pi_i) riXiB(πi)。因此,

E { r i ∣ X i } = π i E\left\{\left. r_i \right| \boldsymbol{X}_i \right\} = \pi_i E{riXi}=πi

于是,

E { r i π i ∣ X i } = E { r i ∣ X i } π i = π i π i = 1 E\left\{\left.\frac{r_i}{\pi_i} \right| \boldsymbol{X}_i\right\} = \frac{E\left\{\left. r_i \right| \boldsymbol{X}_i \right\}}{\pi_i} = \frac{\pi_i}{\pi_i} = 1 E{πiri Xi}=πiE{riXi}=πiπi=1

因此,

E { r i π i − 1 ∣ X i } = 1 − 1 = 0 E\left\{\left.\frac{r_i}{\pi_i} - 1 \right| \boldsymbol{X}_i\right\} = 1 - 1 = 0 E{πiri1 Xi}=11=0

这表明,逆概率加权调整在给定 X i \boldsymbol{X}_i Xi的条件下,平均而言是无偏的。通过这种方式,我们能够有效地处理缺失数据,减少估计偏差,提高分析的准确性。

希望这些解释能够帮助你更好地理解这些概念及其背后的数学原理。

假设 r i r_i ri 服从参数为 π i \pi_i πi 的伯努利分布:

E { r i ∣ X i } = π i E\left\{\left. r_i \right| \boldsymbol{X}_i \right\} = \pi_i E{riXi}=πi

因此,

E { r i π i ∣ X i } = 1 π i E { r i ∣ X i } = π i π i = 1 E\left\{\left. \frac{r_i}{\pi_i} \right| \boldsymbol{X}_i \right\} = \frac{1}{\pi_i} E\left\{\left. r_i \right| \boldsymbol{X}_i \right\} = \frac{\pi_i}{\pi_i} = 1 E{πiri Xi}=πi1E{riXi}=πiπi=1

由此可得,

E { r i π i − 1 ∣ X i } = 1 − 1 = 0 E\left\{\left. \frac{r_i}{\pi_i} - 1 \right| \boldsymbol{X}_i \right\} = 1 - 1 = 0 E{πiri1 Xi}=11=0

这表明,逆概率加权调整项 r i π i \frac{r_i}{\pi_i} πiri 在给定 X i \boldsymbol{X}_i Xi 的条件下,其期望值为 1,因此其中心化版本 r i π i − 1 \frac{r_i}{\pi_i} - 1 πiri1 的期望值为零。这意味着,平均而言,逆概率加权调整不会引入偏差,从而确保估计量在给定 X i \boldsymbol{X}_i Xi 的条件下保持无偏性。

总结如下:

  • 随机缺失(MAR):数据的缺失仅依赖于已观测的数据,而不依赖于未观测的数据,这使得我们能够基于观测数据的概率来调整缺失数据的影响。

  • 逆概率加权(IPW):通过将每个观测数据点的权重设置为其被观测概率的倒数,我们能够平衡数据,减少因缺失数据引入的偏差。

  • 期望条件:逆概率加权调整项在给定 X i \boldsymbol{X}_i Xi 的情况下,平均值为 1,确保了估计的无偏性。

随机缺失意味着缺失仅依赖于已观测的数据,逆概率加权通过使用被观测概率的倒数作为权重来调整缺失数据,确保在给定  X i 的情况下,期望调整项的平均值为零,从而保证估计的无偏性。 \boxed{ \text{随机缺失意味着缺失仅依赖于已观测的数据,逆概率加权通过使用被观测概率的倒数作为权重来调整缺失数据,确保在给定 } \boldsymbol{X}_i \text{ 的情况下,期望调整项的平均值为零,从而保证估计的无偏性。} } 随机缺失意味着缺失仅依赖于已观测的数据,逆概率加权通过使用被观测概率的倒数作为权重来调整缺失数据,确保在给定 Xi 的情况下,期望调整项的平均值为零,从而保证估计的无偏性。

上面的推导我基本明白了,但是为什么期望为0就是无偏呢?无偏性难道不是估计量的期望等于真参数嘛?

无偏性通常是指估计量的期望等于真实参数值。但在这里,我们讨论的是逆概率加权调整项的期望为零,这和无偏性有什么关系呢?

让我试着理清这个逻辑。

首先,我们有一个估计量 θ ^ \hat{\theta} θ^,如果它是无偏的,那么:

E { θ ^ } = θ E\left\{ \hat{\theta} \right\} = \theta E{θ^}=θ

在这个具体的情境中,我们的目标是通过逆概率加权调整目标函数来得到一个无偏的估计量。具体来说,我们使用了加权后的目标函数:

∑ i = 1 n r i π i M \sum_{i=1}^n \frac{r_i}{\pi_i} M i=1nπiriM

这里的 r i π i \frac{r_i}{\pi_i} πiri 是逆概率加权调整项。我们已经证明了:

E { r i π i − 1 ∣ X i } = 0 E\left\{\left. \frac{r_i}{\pi_i} - 1 \right| \boldsymbol{X}_i \right\} = 0 E{πiri1 Xi}=0

也就是说, r i π i \frac{r_i}{\pi_i} πiri 的期望值在给定 X i \boldsymbol{X}_i Xi 的情况下是 1。

那么,这如何保证我们的估计量是无偏的呢?

让我们考虑一下估计量的期望。假设我们的估计量是:

β ^ h = arg ⁡ min ⁡ β ∑ i = 1 n r i π i M \hat{\beta}_h = \arg \min_{\beta} \sum_{i=1}^n \frac{r_i}{\pi_i} M β^h=argβmini=1nπiriM

为了证明 β ^ h \hat{\beta}_h β^h 是无偏的,我们需要证明:

E { β ^ h } = β E\left\{ \hat{\beta}_h \right\} = \beta E{β^h}=β

直接计算这个期望可能比较复杂,但我们可以从目标函数的角度来考虑。如果调整项 r i π i \frac{r_i}{\pi_i} πiri 的期望为 1,那么在期望意义上,加权后的目标函数与未加权的目标函数是一致的:

E { ∑ i = 1 n r i π i M } = ∑ i = 1 n E { r i π i } M = ∑ i = 1 n M E\left\{ \sum_{i=1}^n \frac{r_i}{\pi_i} M \right\} = \sum_{i=1}^n E\left\{ \frac{r_i}{\pi_i} \right\} M = \sum_{i=1}^n M E{i=1nπiriM}=i=1nE{πiri}M=i=1nM

这表明,逆概率加权调整项在期望上没有引入额外的偏差,因此最小化加权目标函数应该能够得到与最小化真实目标函数相同的估计量,从而保证估计量的无偏性。

换句话说,虽然我们是在处理缺失数据,通过逆概率加权调整,我们确保了在期望上,估计量的行为与没有缺失数据时是一致的。因此,即使数据有缺失,估计量的期望仍然等于真实参数值,从而保证了无偏性。

总结一下:

  • 逆概率加权调整项的期望为 1:这确保了加权后的目标函数在期望上与未加权的目标函数一致。

  • 无偏性:因为加权目标函数的期望没有引入额外的偏差,估计量在期望上等于真实参数值。

逆概率加权调整项的期望为1,确保了加权目标函数在期望上与真实目标函数一致,从而保证了估计量的无偏性。 \boxed{ \text{逆概率加权调整项的期望为1,确保了加权目标函数在期望上与真实目标函数一致,从而保证了估计量的无偏性。} } 逆概率加权调整项的期望为1,确保了加权目标函数在期望上与真实目标函数一致,从而保证了估计量的无偏性。

这里的 π i \pi_i πi是什么意思?是指的第 i i i个样本的概率吗, 如何获得呢?

让我来解释一下 π i \pi_i πi 的含义。

在前面的讨论中, π i \pi_i πi 被定义为 r i r_i ri 为 1 的概率,即 Y i Y_i Yi 被观测到的概率。具体来说:

π i = π ( X i ) = P ( r i = 1 ∣ X i ) \pi_i = \pi(\boldsymbol{X}_i) = P(r_i = 1 \mid \boldsymbol{X}_i) πi=π(Xi)=P(ri=1Xi)

因此, π i \pi_i πi 表示第 i i i 个样本的 Y i Y_i Yi 被观测到的条件概率,这个概率依赖于第 i i i 个样本的协变量 X i \boldsymbol{X}_i Xi

在随机缺失(MAR)的假设下,缺失机制仅依赖于已观测的数据 X i \boldsymbol{X}_i Xi,而不依赖于未观测的 Y i Y_i Yi。这使得 π i \pi_i πi 可以基于 X i \boldsymbol{X}_i Xi 来建模和估计,从而允许我们使用逆概率加权等方法来调整缺失数据的影响。

总结一下, π i \pi_i πi 是第 i i i 个样本的 Y i Y_i Yi 被观测到的概率,具体为:

π i = P ( r i = 1 ∣ X i ) \boxed{ \pi_i = P(r_i = 1 \mid \boldsymbol{X}_i) } πi=P(ri=1Xi)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/65955.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

极客说|Azure AI Agent Service 结合 AutoGen/Semantic Kernel 构建多智能体解决⽅案

作者:卢建晖 - 微软高级云技术布道师 「极客说」 是一档专注 AI 时代开发者分享的专栏,我们邀请来自微软以及技术社区专家,带来最前沿的技术干货与实践经验。在这里,您将看到深度教程、最佳实践和创新解决方案。关注「极客说」&am…

【集成学习】Boosting算法详解

文章目录 1. 集成学习概述2. Boosting算法详解3. Gradient Boosting算法详解3.1 基本思想3.2 公式推导 4. Python实现 1. 集成学习概述 集成学习(Ensemble Learning)是一种通过结合多个模型的预测结果来提高整体预测性能的技术。相比于单个模型&#xf…

小米vela系统(基于开源nuttx内核)——如何使用信号量进行PV操作

如何使用信号量进行PV操作 前言信号量1. 信号量简介2. NuttX中信号量的创建与使用2.1 Nuttx信号量的初始化和销毁2.2 信号量的等待和发布 3. 信号量的实际应用:下载任务示例3.1 实际代码3.2 代码说明3.3 执行说明 4. 信号量的优势与应用场景5. 常见应用场景&#xf…

CMake学习笔记(2)

1. 嵌套的CMake 如果项目很大,或者项目中有很多的源码目录,在通过CMake管理项目的时候如果只使用一个CMakeLists.txt,那么这个文件相对会比较复杂,有一种化繁为简的方式就是给每个源码目录都添加一个CMakeLists.txt文件&#xff…

【C++】size_t究竟是什么?全面解析与深入拓展

博客主页: [小ᶻ☡꙳ᵃⁱᵍᶜ꙳] 本文专栏: C 文章目录 💯前言💯一、什么是size_t?为什么需要size_t? 💯二、size_t的特性与用途1. size_t是无符号类型示例: 2. size_t的跨平台适应性示例对…

【物流管理系统 - IDEAJavaSwingMySQL】基于Java实现的物流管理系统导入IDEA教程

有问题请留言或私信 步骤 下载项目源码:项目源码 解压项目源码到本地 打开IDEA 左上角:文件 → 新建 → 来自现有源代码的项目 找到解压在本地的项目源代码文件,点击确定,根据图示步骤继续导入项目 查看项目目录&#xff…

ssh2-sftp-client和ssh2配合使用js脚本快速部署项目到服务器

有时候因为服务器不能实现github或者gitlab的自动部署服务,所以就需要使用脚本来实现自动部署,可以省时省力,一劳永逸。这里就使用ssh2-sftp-client和ssh2来实现,即便是需要sudo权限,也是可以的。 1.先将本地打包后的…

深度解析Linux中的调试器gdb/cgdb的使用

Linux下我们编译好的代码,无法直接调试 gcc/g默认的工作模式是realse模式 程序要调试的话,必须是debug模式,也就是说编译的时候要加-g选项 gdb携带调试信息的exe 我们现在在文件夹里面创建一个文件lesson11 里面创建一个累加的代码&…

【Maui】动态菜单实现(绑定数据视图)

前言 .NET 多平台应用 UI (.NET MAUI) 是一个跨平台框架,用于使用 C# 和 XAML 创建本机移动和桌面应用。 使用 .NET MAUI,可从单个共享代码库开发可在 Android、iOS、macOS 和 Windows 上运行的应用。 .NET MAUI 是一款开放源代码应用,是 X…

RNN之:LSTM 长短期记忆模型-结构-理论详解-及实战(Matlab向)

0.前言 递归!循环神经网络Recurrent Neural Network 循环神经网络(又称递归神经网络,Recurrent Neural Network,RNN)。是一种用于处理序列数据的神经网络结构,具有记忆功能,能够捕捉序列中的时…

泛目录和泛站有什么差别

啥是 SEO 泛目录? 咱先来说说 SEO 泛目录是啥。想象一下,你有一个巨大的图书馆,里面的书架上摆满了各种各样的书,每一本书都代表着一个网页。而 SEO 泛目录呢,就像是一个超级图书管理员,它的任务就是把这些…

【Vue】全局/局部组件使用流程(Vue2为例)

全局组件和局部组件区别 如何使用 全局组件:全局注册后,可以在任意页面中直接使用。局部组件:在页面中需要先导入子组件路径,注册组件才能使用。 适用场景 全局组件:适用于高频使用的组件,如导航栏、业…

【Pytorch实用教程】PyTorch 中如何输出模型参数:全面指南

文章目录 PyTorch 中如何输出模型参数:全面指南1. 为什么需要输出模型参数?2. PyTorch 中输出模型参数的方法2.1 使用 `model.parameters()` 输出所有参数2.2 使用 `model.named_parameters()` 输出参数名称和值2.3 使用 `model.state_dict()` 输出模型的参数字典2.4 输出特定…

1、docker概念和基本使用命令

docker概念 微服务:不再是以完整的物理机为基础的服务软件,而是借助于宿主机的性能。以小量的形式,单独部署的应用。 docker:是一个开源的应用容器引擎,基于go语言开发的,使用时apache2.0的协议。docker是…

Genymotion配套VirtualBox所在地址

在 Genymotion打开虚拟机前需要先打开VirtualBox中的虚拟机 C:\Program Files\Oracle\VirtualBox\VirtualBox.exe 再开启genymotion中的虚拟机开关

【Linux】深刻理解软硬链接

一.软硬链接操作 1.软连接 touch 创建一个文件file.txt ,对该文件创建对应的软链接改怎么做呢? ln -s file.txt file-soft.link .给对应文件创建软连接。 软连接本质就是一个独立的文件,因为我们对应的软连接有独立的inode,他…

第三十六章 Spring之假如让你来写MVC——拦截器篇

Spring源码阅读目录 第一部分——IOC篇 第一章 Spring之最熟悉的陌生人——IOC 第二章 Spring之假如让你来写IOC容器——加载资源篇 第三章 Spring之假如让你来写IOC容器——解析配置文件篇 第四章 Spring之假如让你来写IOC容器——XML配置文件篇 第五章 Spring之假如让你来写…

快速上手 HarmonyOS 应用开发

一、DevEco Studio 安装与配置 1. DevEco Studio 简介 DevEco Studio 是 HarmonyOS 的一站式集成开发环境(IDE),提供了丰富的工具和功能,支持 HarmonyOS 应用开发的全流程。 2. DevEco Studio 下载与安装 下载地址&#xff1a…

Java Web开发进阶——错误处理与日志管理

错误处理和日志管理是任何生产环境中不可或缺的一部分。在 Spring Boot 中,合理的错误处理机制不仅能够提升用户体验,还能帮助开发者快速定位问题;而有效的日志管理能够帮助团队监控应用运行状态,及时发现和解决问题。 1. 常见错误…

图解Git——分支的新建与合并《Pro Git》

⭐分支的新建与合并 先引入一个实际开发的工作流: 开发某个网站。为实现某个新的需求,创建一个分支。在这个分支上开展工作。 正在此时,你突然接到一个电话说有个很严重的问题需要紧急修补。你将按照如下方式来处理: 切换到你…