双变量probit模型

1. Probit模型

1.1 模型含义

假设个体只有两种选择,y=1或y=0。影响选择的变量都包括在向量x中。即线性概率模型为

y_{i}=x_{i}^{'}\beta +\varepsilon _{i}

y值服从两点分布

P(y=1|x)=F(x,\beta )

P(y=0|x)=1-F(x,\beta )

F(x,\beta )被认为是连接函数,函数选择具有一定的灵活性。如果F(x,\beta )为标准正态的累积分布函数,则模型成为Probit模型;如果F(x,\beta )为逻辑分布的累积分布函数,则为Logit模型。其实,这两种分布函数的公式很相似,函数值相差也并不大,唯一的区别在于逻辑概率分布函数的尾巴比正态分布粗一些。然而,如果因变量是序次变量,回归时只能用有序Probit模型。有序Probit可以看作是Logit的扩展。

Probit模型是一种服从正态分布的非线性模型,可使用最大似然法进行估计。

1.2 如何衡量二值模型的拟合优度

由于不存在平方和分解公式,故无法计算R^{2},使用由McFadden(1974)提出:

R^{2}=\frac{lnL_{0}-lnL_{1}}{lnL_{max}-lnL_{0}}

其中lnL_{1}为原模型的对数似然函数之最大值,而lnL_{0}为以常数项为唯一解释变量的对数似然函数之最大值。

1.2 Probit模型的缺点

Probit回归的偏回归系数含义为,其他自变量保持不变时,该自变量每增加一个单位,出现某个结果的概率密度函数的改变值,这很难以理解。因此Probit模型的回归系数经济意义很难解释,不够直观;而Logistic回归的偏回归系数解释起来更加直观和易于理解,其经济意义也更加明显,所以,一般情况下,Logit模型比Probit模型更简单,应用更广泛。

1.4 可用Probit回归替代Logistic回归的情况

(1)自变量中连续型变量较多。
(2)残差符合正态分布。

2. Bivariate Probit 模型

该模型是Probit模型的拓展,适用于模型中有两个结果变量且假定方程组的随机扰动项之间存在相关性,模型中的方程需同时进行估计。双变量Probit模型是两个二元变量结果的联合模型。如果这两个二元变量的结果是不相关的,我们可以估计两个独立的 Probit 模型,如果这两个二元变量的结果是相关的,使用Probit 模型会导致估计结果偏差并影响结论,则需要使用 Bivariate Probit 模型。比如两个被解释变量,一个是病人是否去看医生,一个是病人是否住院。“看医生”和“住院”两件事通常是相关的,即probit方程的扰动想之间可能存在相关性。

其中,Y_{1}^{*}与 Y_{2}^{*} 为不可观测的潜变量, 扰动项(\mu _{1},\mu _{2})服从二维联合正态分布, 期望为 0 , 方差为 1 , 而相关系数为 \rho, 即

可观测变量 Y_{1}与 Y_{2}由以下方程决定:

当 (24) 式的两个方程的解释变量完全相同, 即 X_{1}=X_{2}时, 即为 “双变量 Probit 模型”。反之, 当两个方程的解释变量不完全相同, 即 X_{1}\neq X_{2}时, 该模型被称为 “似不相关双变量 Probit 模型”, 因为该模型中两个方程的唯一联系是扰动项的相关性。 若 \rho=0, 则该模型等价于两个单独的 Probit 模型。当 \rho≠0 时, 可写下(Y_{1}, Y_{2})的取值概率, 然后进行最大似然估计。比如:

其中, \phi (z_{1},z_{2},\rho ) 和 \Phi (z_{1},z_{2},\rho ) 分别为标准化的二维正态分布的概率密度函数 (PDF) 和累积分布函数 (CDF), 这个标准化的二维正态分布的期望为 0 , 方差为 1 , 而相关系数为\rho。 类似地, 可计算出 

对不同的个体计算(Y_{1}, Y_{2})的概率, 由此得到所有个体的 (Y_{1}, Y_{2})的概率(这里每一个个体对应的(Y_{1}, Y_{2})的概率是唯一的)。将它们全部相乘得到模型的似然函数, 取对数得到对数似然函数, 再由对数似然函数最大化一阶条件可以得到\frac{\partial lnL}{\partial \beta _{1}}=0 ,\frac{\partial lnL}{\partial \beta _{2}}=0,\frac{\partial lnL}{\partial \rho }=0三个方程, 联立它们就可以求解出参数 \beta _{1},\beta _{2},\rho的值, 当然这也需要数值方法计算得到。最后, 对原假设H_{0}:\rho =0进行检验, 可判断有无必要使用双变量 Probit 模型, 或估 计两个单独的 Probit模型。

双变量Probit的stata命令为:
biprobit y1 y2 x1 x2 x3,r    (解释变量完全相同)
biprobit (y1=x1 x2)(y2=x1 x3),r nolog   (解释变量不完全相同)

3. 部分可观测的双变量 Probit 模型

有时候, 我们无法同时观测到 Y_{1} 与Y_{2}  , 而只能看到 Y_{1} 与Y_{2}  都取值为 1 的情况。比如, 估计实习生在某公司实习后留任的概率。显然, “留任” 既取决于该公司是否向该实习生发聘书 (公司的二值选择), 也取决于该实习生是否愿意在此公司工作 (实习生的二值选择)。 而我们只能观测到该实习生是否留任了。如果留任, 则Y_{1}与 Y_{2}  都取值为 1; 如果末留任, 则只知道Y_{1} 与 Y_{2}  至少有一个为 0。在此情况下, 公司的二值选择与实习生的二值选择可能相关, 故适用于双变量 Probit 模型的框架。但对于  Y_{1} 与Y_{2}  只有其乘积 Y_{1}Y_{2} 可观测, 要么  Y_{1}\times Y_{2}=1Y_{1}\times Y_{2}=0,此时定义Z=Y_{1}\times Y_{2}

我们对 \beta _{1},\beta _{2},\rho做最大似然估计

参数\beta _{1},\beta _{2},\rho的对数似然函数的最大化一阶条件分别为

biprobit (y1=x1 x2)(y2=x1 x3),r partial difficult

 partial表示部分可观测的双变量probit,但加上这个选择后可能使得数值计算不收敛。如果不收敛,可使用difficult表示在最大化目标函数存在非凹区域的情况下,使用另一种迭代方法。

在实际中我们只能观测到Y_{1}\times Y_{2},记Z_{1}=Y_{1}\times Y_{2},定义Z_{2}=Z_{1}然后再进行估计

gen z2=z1
biprobit(z1 =x1 x2)(z2=x1 x3),r partial difficult nolog

3.1 模型的优势

(1)双变量Probit模型能够解决两个方程间的内在联系问题,提高估计的效率。
(2)双变量Probit模型是解决对两个虚拟变量同时考虑其发生的概率的模型,当两个Probit方程的扰动项之间可能存在相关性,如果对这两个被解释变量分别进行建模,则估计结果会损失效率。也就是说当对两个相关的被解释变量进行研究时,比如上述提到的“看医生”和“住院”这两件相关联的事情,就可以使用双变量Probit模型,避免估计结果效率的损失,使估计结果更为准确。

3.2 模型的缺点

(1)双变量Probit模型必须假设随机变量服从正态分布,相比与Logit模型,没有那么简单直接,应用更窄。
(2)假设条件比较严格,计算过程复杂,且有较多近似处理。
(3)在现实经济中,经济主体无法同时观测到y1和y2,只能观察到同时为1的情况。比如,估计实习生在某公司实习后留任的概率。我们一般只能观测到该实习生是否留任。
(4)存在稀有事件偏差。虽然使用MLE(比如Probit 或Logit)来估计二值选择模型是一致的,但在有限样本下(样本容量小于200) , Probit或Logit估计依然存在偏差。而且,如果存在稀有事件,则该偏差将进一步放大;导致即使样本容量达到数千,而偏差依然存在,称为“稀有事件偏差( rare event bias)”。例如战争、政变、革命、流行病、经济危机、百年一遇的灾害等。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/603658.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

NACHI机器人模拟示教器如何切换中文

前言 现在开始学习机器人的编程语言,那么要学习会用首先得用模拟示教器来学习,但是全是英文确实比较难受一些些,没有中文来的直观。所以摸透一下如何给示教器更换语言。 具体步骤 步骤一:将中文的汉化包下载下来。具体的下载链…

Spring AOP—通知类型 和 切入点表达式 万字详解(通俗易懂)

目录 一、前言 二、AOP—快速入门 1.动态代理优化 : 2.问题分析 : 3.AOP—基本介绍 : 4.AOP—使用说明 : 5.AOP—入门案例 : 三、AOP—切入点表达式 1.基本说明 : 2.语法格式 : 3.注意事项 : 4.代码演示 : 四、AOP—切入点表达式的更多细节 1.JoinPoint : 1.1 简…

华为HCIE课堂笔记第十三章 IPv6地址配置

目录 第十三章 IPv6地址配置 13.1 IPv6地址无状态自动配置 13.1.1 RS和RA报文格式 13.1.2 RA的Flags字段 13.1.3 地址的生存周期 13.1.4 RA报文中前缀中的Flags 13.2 DHCPv6 13.2.1 DHCPV6的概念 13.2.2 DCHPv6的报文 第十三章 IPv6地址配置 13.1 IPv6地址无状态自动…

ENVI无法打开Landsat8的头文件问题和解决

问题 解决方案 双击打开该xxx_MTL.txt的头文件 第一行GROUP LANDSAT_METADATA_FILE 改为 GROUP L1_METADATA_FILE 按住CTRLF,查找GROUP LEVEL1_PROCESSING_RECORD 会查到两个包含的句子,把这两个中间的部分全部删掉 删除空行后,应该为…

基于Python+Django,开发一款房屋租赁系统

学习文档 学习过程中,遇到问题可以咨询作者 功能介绍 平台采用B/S结构,后端采用主流的PythonDjango进行开发,前端采用主流的Vue.js进行开发。 整个平台包括前台和后台两个部分。 前台功能包括:首页、房屋详情页、用户中心模块。…

学习使用js/jquery获取指定class名称的三种方式

学习使用js/jquery获取指定class名称的三种方式 简介一、获取元素的class名称1、通过原生JS获取元素的class名称2、通过Jquery获取元素的class名称 二、应用1、样式修改2、动画效果实现 简介 在开发网页时,我们经常需要通过JS获取元素的class名称进行一些操作&…

IMU用于无人机故障诊断

最近,来自韩国的研究团队通过开发以IMU为中心的数据驱动诊断方法,旨在多旋翼飞行器可以自我评估其性能,即时识别和解决推进故障。该方法从单纯的常规目视检查跃升为复杂的诊断细微差别,标志着无人机维护的范式转变。 与依赖额外传…

Unity中Shader面片一直面向摄像机(个性化修改及适配BRP)

文章目录 前言一、个性化修改面向摄像机效果1、把上一篇文章中求的 Z轴基向量 投影到 XoZ平面上2、其余步骤和之前的一致3、在属性面板定义一个变量,控制面片面向摄像机的类型4、效果 二、适配BRP三、最终代码 前言 在上一篇文章中,我们用Shader实现了面…

Vim 快速指南:高效删除文本行

🧙‍♂️ 诸位好,吾乃诸葛妙计,编程界之翘楚,代码之大师。算法如流水,逻辑如棋局。 📜 吾之笔记,内含诸般技术之秘诀。吾欲以此笔记,传授编程之道,助汝解技术难题。 &…

阿里巴巴中国站按图搜索1688商品(拍立淘) API(1688.item_search_img)在电商中的前景

一、引言 随着移动互联网的快速发展和普及,越来越多的消费者开始通过手机等移动设备进行购物。在这个背景下,电商企业需要不断创新和改进,以满足消费者的需求和提供更好的购物体验。其中,按图搜索商品的技术成为了电商领域的一个…

C++ 求一个数是否是丑数。

#include<string.h> #include <iostream> using namespace std; int isChou(int num) { if (num < 0) { return 0; } while (num % 2 0) { // 不断除以2&#xff0c;直到不能整除为止 num / 2; } while (num % 3 0) { // 不断除…

操作系统期末复习笔记(持续更新..)

一、操作系统的基本概念 1.1 操作系统概念 控制和管理整个计算机系统的硬件与软件资源。合理地组织、调度计算机的工作与资源。为用户和其他软件提供方便接口与环境的程序集合。 1.2 操作系统的特征 特征&#xff1a;并发&#xff0c;共享&#xff0c;虚拟&#xff0c;异步…

数据结构复习部分机考题-自用

A.二叉树孩子链表法之找家人 题目描述 给出二叉树的孩子链表表示法&#xff0c;根据输入要求&#xff0c;找指定结点的双亲或孩子 输入 第一行输入两个参数&#xff0c;第一个参数n表示树有n个结点&#xff0c;第二个参数r表示根结点的数组下标 接着n行&#xff0c;每行先…

kotlin chunked 和 windowed

kotlin chunked的作用 将集合按照指定的数量分割成多个结合 val numbers listOf(0,1,2,3,4,5,6,7,8,9) //把集合按照一个结合3个元素分割 Log.d("chunked", numbers.chunked(3).toString()) // 打印结果 [[0, 1, 2], [3, 4, 5], [6, 7, 8], [9]] kotlin windowed…

带大家做一个,易上手的家常香干炒腊肉

从冰箱那一块腊肉 套个食品级的袋子 然后用冷水化冰 准备两块香干 香干切成片 不要太薄 当然也别厚了 一把青蒜 青蒜切成段 干和叶子分开装 腊肉去掉下面的肉皮 然后切小块 锅中加入清水 下入少量油和盐 开小火 水起泡泡后下入香干 过水 半分钟左右 香干捞出备用 将腊…

条件竞争之文件上传

一、条件竞争介绍 条件竞争,在程序员日常的Web应用开发中&#xff0c;通常不如其他漏洞受到的关注度高。因为普遍的共识是&#xff0c;条件竞争是不可靠的&#xff0c;大多数时候只能靠代码审计来识别发现&#xff0c;而依赖现有的工具或技术很难在黑盒灰盒中识别并进行攻击。…

ICMP隐蔽隧道工具Pingtunnel搭建隧道(附搭建环境避坑超详细)

工具介绍可参考其他博主文章&#xff0c;这里直接上环境搭建和踩坑避坑后的工具攻击过程。 目录 环境搭建 #安装libpcap的依赖环境 打通隧道&#xff08;linux服务端开启监听&#xff09; 连接测试&#xff08;kali攻击机上启动&#xff09; 远控攻击&#xff08;win7&…

进程间通信之共享内存及其shm函数的使用【Linux】

进程间通信之共享内存及其shm函数的使用 什么是共享内存共享内存的内核数据结构 如何实现共享内存共享内存函数shmget函数ftok函数 shmat函数shmdt函数shmctl函数 代码实现 什么是共享内存 共享内存区是最快的IPC&#xff08;Inter-Process Communication&#xff0c;进程间通信…

腾讯云导入导出镜像官方文档

制作与导出 Linux 镜像 https://cloud.tencent.com/document/product/213/17814 制作与导出 Windows 镜像 ​​​​​​https://cloud.tencent.com/document/product/213/17815 云服务器 导出镜像-操作指南-文档中心-腾讯云 (tencent.com) 轻量应用服务器 管理共享镜像-操作指…

GitEE-GitHub实现加速访问与下载项目

gitee域名&#xff1a;https://gitee.com gitee域名&#xff1a;https://github.com 一、从github导出项目到gitee上面&#xff0c;从而实现加速访问与下载 gitee和github都有同步其他仓库的功能&#xff0c;比如码云上就能直接从github或gitlab中导入&#xff1b; 只需要填…