异方差的Stata操作(计量114)

以数据集 nerlove.dta 为例,演示如何在 Stata 中处理异方差。
此数据集包括以下变量:
tc ( 总成本 )
q ( 总产量 )
pl ( 工资率 )
pk ( 资本的使用成本 )
pf ( 燃料价格 )
相应的对数值 lntc lnq lnpl lnpk lnpf

1.画残差图

  • 通过观察残差图,如果残差随着拟合值或某个解释变量的变化而呈现系统性的变化趋势(如增大或减小),则可能表明存在异方差性。异方差性意味着误差项的方差不是常数,而是随着某些变量的变化而变化。
首先,以 OLS 估计对数形式的成本函数:
use nerlove.dta,clear
reg lntc lnq lnpl lnpk lnpf
完成回归后,可使用以下命令得到残差图:
rvfplot                                         (residual-versus-fitted plot)
rvpplot varname                        (residual-versus-predictor plot)
varname :是变量的名字,把它代称自己数据的名字。
  • 初步考察异方差,画残差与拟合值的散点图:        rvfplot

               当总成本 (lntc 的拟合值 ) 较小时,扰动项的方差较大。
  • 考察残差与解释变量 lnq 的散点图:                     rvpplot lnq

               当产量 (lnq) 越小时,扰动项的方差越大。
    初步判断是复杂性的异方差

2.BP检验

  • BP检验的基本思想是通过检验残差的平方与自变量之间是否存在显著的相关关系来判断模型的异方差性。在标准的线性回归模型中,假设误差项(即残差)的方差是恒定的。然而,在实际应用中,这一假设可能不成立,即存在异方差性。BP检验通过构建一个辅助回归模型来检验这种异方差性。
Stata 中完成回归后,可使用以下命令进行 BP检验:
hettest // 对所有变量进行 BP 检验         
或:estat hettest,iid rhs
其中,“ estat ”指 post-estimation statistics( 估计后统计量 ),即在完成估计后所计算的后续统计量。
“hettest” 表示 heteroskedasticity test
选择项 ”iid” 表示仅假定数据为 iid (独立同分布),而无须正态假定。
选择项”rhs”表示使用方程右边的全部解释变量进行辅助回归,默认使用拟合值 \hat{y} 进行辅助回归。
如想指定使用某些解释变量进行辅助回归,可使用命令:
hettest variable // 对指定变量进行 BP 检验
或: estat hettest [varlist],iid
其中, ”[varlist]” 为指定的变量清单;而 ”[ ]”表示其中的内容可出现在命令中,也可不出现。
  • 回到 Nerlove(1963)的例子:
  • quietly reg lntc lnq lnpl lnpk lnpf       //其中,前缀(prefix) ”quietly”表示执行此命令,但不在Stata的结果窗口显示运行结果
  • 首先,使用拟合值 \hat{y} 进行 BP 检验        estat hettest, iid

  • 其次,使用所有解释变量进行 BP 检验:  estat hettest, iid rhs

  • 最后,使用变量 lnq 进行 BP 检验:          estat hettest lnq,iid

各种形式 BP 检验的 𝑝 值都等于 0.0000,故强烈拒绝同方差的原假设,认为存在异方差。

3.怀特检验

  • 基本思想是如果模型存在异方差性,那么残差的平方应该与模型的解释变量有关。
  • 构造一个辅助回归模型,以残差的平方作为因变量,将原始回归模型中的解释变量及其平方项和交叉项作为自变量。如果辅助回归模型的解释变量对残差平方没有影响,即原假设成立,那么辅助回归模型的R平方应该很小。
在 Stata 完成回归后,可使用如下命令进行怀特检验:  
whitetst
或: estat imtest,white
其中, ”imtest” information matrix test( 信息矩阵检验 )
  • 继续以Nerlove(1963)为例:
  • estat imtest,white

 4.稳健标准误

稳健标准误在 Stata 中十分简单,在命令 reg之后加选择项加“ robust ”即可
reg lntc lnq lnpl lnpk lnpf, robust          // 截面数据
reg lntc lnq lnpl lnpk lnpf, vce(hc2)      // 小样本下,更稳健
reg lntc lnq lnpl lnpk lnpf, vce(hc3)      // 小样本下,更稳健
混合截面数据或面板数据,应使用 vce (cluster clustvar) 选项。

5.FGLS (可行的GLS估计量)

纠正异方差的 FGLS 程序:
① 利用估计模型  𝑦 = 𝛽 0 + 𝛽 1 𝑥 1 + 𝛽 2 𝑥 2 + ⋯ + 𝛽 𝑘 𝑥 𝑘 + 𝜇 得到 OLS 的残差 \hat{\mu }
② 对残差 \hat{\mu } 进行平方,然后再取自然对数得到 log(\hat{\mu }^{2})
③ 利用log(\hat{\mu }^{2})对 𝑥 1 , 𝑥2, … . , 𝑥𝑘进行回归,得到拟合值  \hat{g}
④ 获得拟合值的指数:\hat{h}=exp (\hat{g})
⑤ 以 1/\hat{h} 为权数,用 WLS 估计方程 𝑦 = 𝛽 0 + 𝛽 1 𝑥 1 + 𝛽 2 𝑥 2 + ⋯ + 𝛽 𝑘 𝑥 𝑘 + 𝜇
得到扰动项方差的估计值 \hat{\sigma} _{i}^{2} 后,可作为权重进行 WLS 估计。
假设 \hat{\sigma} _{i}^{2} 存储在变量 var 上,可通过如下 Stata 命令来实现 WLS
reg y x1 x2 x3 [aw=1/var]
其中,“ aw” 表示 analytical weight ,为扰动项方差 (不是标准差 ) 的倒数。
  • 继续以 Nerlove(1963)为例。
  • 首先计算残差,并记为 e1
    quietly reg lntc lnq lnpl lnpk lnpf
    predict e1,residual
  • 其次,生成残差的平方,并记为 e2:
    gen e2=e1^2
  • 将残差平方取对数,
    gen lne2=log(e2)
  • 假设 ln\hat{\sigma} _{i}^{2}  为变量 lnq 的线性函数,进行辅助回归:
    reg lne2 lnq lnpl lnpk lnpf
  • 计算辅助回归的拟合值,并记为 lne2f:
    predict lne2f
  • 去掉对数后,即得到方差的估计值,并记为 e2f
    gen e2f=exp(lne2f)
  • 使用方差估计值的倒数作为权重,进行 WLS 回归:
    reg lntc lnq lnpl lnpk lnpf [aw=1/e2f]

使用 OLS 时,变量 lnpl 𝑝 值为 0.13 ,在 10%的水平上也不显著;使用 WLS 后,该变量的 𝑝值变为 0.002 ,在 1% 的水平上显著不为 0
由于 Nerlove(1963)数据存在明显的异方差,使用WLS 后提高了估计效率。
  • 如担心条件方差函数的设定不准确,导致加权后的新扰动项仍有异方差,可使用稳健标准误进行 WLS 估计: reg lntc lnq lnpl lnpk lnpf [aw=1/e2f],r

无论是否使用稳健标准误, WLS 的回归系数都相同,但标准误有所不同。

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/16359.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

GESP等级大纲

CCF编程能力等级认证概述 CCF编程能力等级认证(GESP)为青少年计算机和编程学习者提供学业能力验证的规则和平台。GESP覆盖中小学阶段,符合年龄条件的青少年均可参加认证。C & Python编程测试划分为一至八级,通过设定不同等级…

[自动驾驶技术]-6 Tesla自动驾驶方案之硬件(AI Day 2021)

1 硬件集成 特斯拉自动驾驶数据标注过程中,跨250万个clips超过100亿的标注数据,无论是自动标注还是模型训练都要求具备强大的计算能力的硬件。下图是特斯拉FSD计算平台硬件电路图。 1)神经网络编译器 特斯拉AI编译器主要针对PyTorch框架&am…

AI数据面临枯竭

Alexandr Wang:前沿研究领域需要大量当前不存在的数据,未来会受到这个限制 Alexandr Wang 强调了 AI 领域面临的数据问题。 他指出,前沿研究领域(如多模态、多语言、专家链式思维和企业工作流)需要大量当前不存在的数…

压缩能力登顶 小丸工具箱 V1.0 绿色便携版

平常录制视频或下载保存的视频时长往往都很长,很多时候都想要裁剪、 截取出一些“精华片段”保留下来,而不必保存一整个大型视频那么浪费硬盘空间… 但如今手机或电脑上大多数的视频剪辑软件,切割视频一般都要等待很长时间导出或转换&#…

【C语言回顾】编译和链接

前言1. 编译2. 链接结语 上期回顾: 【C语言回顾】文件操作 个人主页:C_GUIQU 归属专栏:【C语言学习】 前言 各位小伙伴大家好!上期小编给大家讲解了C语言中的文件操作,接下来我们讲解一下编译和链接! 1. 编译 预处理…

H5扫描二维码相关实现

H5 Web网页实现扫一扫识别解析二维码,就现在方法的npm包就能实现,在这个过程中使用过html5-qrcode 和 vue3-qr-reader。 1、html5-qrcode的使用 感觉html5-qrcode有点小坑,在使用的时候识别不成功还总是进入到错误回调中出现类似NotFoundExc…

天干物燥小心火烛-智慧消防可视化大屏,隐患防治于未然。

智慧消防可视化大屏通常包括以下内容: 1.实时监控: 显示消防设备、传感器、监控摄像头等设备的实时状态和数据,包括火灾报警、烟雾报警、温度报警等。 2.建筑结构: 显示建筑物的结构图和平面图,包括楼层分布、消防通…

VLC播放器(全称VideoLAN Client)

一、简介 VLC播放器(全称VideoLAN Client)是一款开源的多媒体播放器,由VideoLAN项目团队开发。它支持多种音视频格式,并能够在多种操作系统上运行,如Windows、Mac OS X、Linux、Android和iOS等。VLC播放器具备播放文件…

特殊变量笔记3

输入一个错误命令, 在输出$? 特殊变量:$$ 语法 $$含义 用于获取当前Shell环境的进程ID号 演示 查看当前Shell环境进程编号 ps -aux|grep bash输出 $$ 显示当前shell环境进程编号 小结 常用的特殊符号变量如下 特殊变量含义$n获取输入参数的$0, 获取当前She…

hugging face笔记:PEFT

1 介绍 PEFT (Parameter-Efficient Fine Tuning) 方法在微调时冻结预训练模型参数,并在其上添加少量可训练的参数(称为适配器)这些适配器被训练用来学习特定任务的信息。这种方法已被证明在内存效率和计算使用上非常高效,同时能产…

线性模型--普通最小二乘法

线性模型 一、模型介绍二、用于回归的线性模型2.1 线性回归(普通最小二乘法) 一、模型介绍 线性模型是在实践中广泛使用的一类模型,该模型利用输入特征的线性函数进行预测。 二、用于回归的线性模型 以下代码可以在一维wave数据集上学习参…

基于51单片机的超声波液位测量与控制系统

基于51单片机液位控制器 (仿真+程序+原理图PCB+设计报告) 功能介绍 具体功能: 1.使用HC-SR04测量液位,LCD1602显示; 2.当水位高于设定上限的时候,对应声光报警报警&am…

【InternLM实战营第二期笔记】02:大模型全链路开源体系与趣味demo

文章目录 00 环境设置01 部署一个 chat 小模型02 Lagent 运行 InternLM2-chat-7B03 浦语灵笔2 第二节课程视频与文档: https://www.bilibili.com/video/BV1AH4y1H78d/ https://github.com/InternLM/Tutorial/blob/camp2/helloworld/hello_world.md 视频和文档内容基…

云计算和大数据处理

文章目录 1.云计算基础知识1.1 基本概念1.2 云计算分类 2.大数据处理基础知识2.1 基础知识2.3 大数据处理技术 1.云计算基础知识 1.1 基本概念 云计算是一种提供资源的网络,使用者可以随时获取“云”上的资源,按需求量使用,并且可以看成是无…

STM32应用开发进阶--IIC总线(SHT20温湿度+HAL库_硬件I2C)

实现目标 1、掌握IIC总线基础知识; 2、会使用软件模拟IIC总线和使用STM32硬件IIC总线; 3、 学会STM32CubeMX软件关于IIC的配置; 4、掌握SHT20温湿度传感器的驱动; 5、具体目标:(1)用STM32硬件IIC驱动S…

49 序列化和反序列化

本章重点 理解应用层的作用,初识http协议 理解传输层的作用,深入理解tcp的各项特性和机制 对整个tcp/ip协议有系统的理解 对tcp/ip协议体系下的其他重要协议和技术有一定的了解 学会使用一些网络问题的工具和方法 目录 1.应用层 2.协议概念 3. 网络计…

CSRF跨站请求伪造实战

目录 一、定义 二、与XSS的区别 三、攻击要点 四、实战 一、定义 CSRF (Cross-site request forgery,跨站请求伪造),攻击者利用服务器对用户的信任,从而欺骗受害者去服务器上执行受害者不知情的请求。在CSRF的攻击场景中,攻击…

C++数据结构——哈希桶HashBucket

目录 一、前言 1.1 闭散列 1.2 开散列 1.3 string 与 非 string 二、哈希桶的构成 2.1 哈希桶的节点 2.2 哈希桶类 三、 Insert 函数 3.1 无需扩容时 3.2 扩容 复用 Insert: 逐个插入: 优缺点比对: 第一种写法优点 第一种写法…

gfast:基于全新Go Frame 2.3+Vue3+Element Plus构建的全栈前后端分离管理系统

gfast:基于全新Go Frame 2.3Vue3Element Plus构建的全栈前后端分离管理系统 随着信息技术的飞速发展和数字化转型的深入,后台管理系统在企业信息化建设中扮演着越来越重要的角色。为了满足市场对于高效、灵活、安全后台管理系统的需求,gfast应…