两阶段最小二乘法原理_R语言代写工具变量与两阶段最小二乘法

我们要估计的模型是

y=a+bx+cd+ey=a+bx+cd+e,

其中是解释变量,,和是我们想要估计的系数。是控制变量,是治疗变量。我们特别关注我们的治疗效果对。

生成数据

首先,让我们生成数据。

假设 的工具变量和之间的相关矩阵如下:

0.001,1,0.7,0.3,

rownames(R)"x","d","z","e")

R

## x d z e

## x 1.000 0.001 0.002 0.001

## d 0.001 1.000 0.700 0.300

## z 0.002 0.700 1.000 0.001

## e 0.001 0.300 0.001 1.000

具体而言,相关性表明

cor(d,e)= 0.3,这意味着是内生的;dd

cor(d,z)= 0.7,这意味着是的强大工具变量;zzdd

cor(z,e)= 0.001,这意味着工具变量满足排除限制,因为它只影响到。zzyydd

现在,让我们使用指定的相关性为,,和生成数据。xxddzzee

nvars = dim(U)[1]

numobs = 1000

random.normal = matrix(rnorm(nvars*numobs,0,1), nrow=nvars, ncol=numobs);

X = U %*% random.normal

newX = t(X)

data = as.data.frame(newX)

attach(data)

数据看起来像这样:

head(data)

## x d z e

## 1 -0.62645381 0.1830168 -0.4694601 1.7474361

## 2 0.32950777 -0.8201385 -0.2255741 0.2818908

## 3 0.57578135 -0.3048125 0.8670061 -0.1795257

## 4 -0.62124058 -2.2153200 -0.7481687 -1.0350488

## 5 -0.01619026 0.9438195 1.2471197 0.5820200

## 6 0.91897737 0.7830549 0.6025820 -1.5924689

以及数据之间的相关性

cor(data)

## x d z e

## x 1.00000000 0.00668391 -0.012319595 0.016239235

## d 0.00668391 1.00000000 0.680741763 0.312192680

## z -0.01231960 0.68074176 1.000000000 0.006322354

## e 0.01623923 0.31219268 0.006322354 1.000000000

正如我们之前指定的那样。

现在让我们指定真正的数据生成过程并生成解释变量yy

y10+1*x+1*d+e

如果我们假装我们不知道真正的关系并使用和来解释,我们对和正确系数应该接近到。

OLS

如果我们只使用OLS来估计系数:

ols

summary(ols)

##

## Call:

## lm(formula = y ~ x + d)

##

## Residuals:

## Min 1Q Median 3Q Max

## -3.2395 -0.5952 -0.0308 0.6617 2.7592

##

## Coefficients:

## Estimate Std. Error t value Pr(>|t|)

## (Intercept) 9.99495 0.03105 321.89 <2e-16 ***

## x 1.01408 0.02992 33.89 <2e-16 ***

## d 1.31356 0.03023 43.46 <2e-16 ***

## ---

## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

##

## Residual standard error: 0.9817 on 997 degrees of freedom

## Multiple R-squared: 0.7541, Adjusted R-squared: 0.7536

## F-statistic: 1528 on 2 and 997 DF, p-value: < 2.2e-16

b的估计系数是1.31 instread of 1. ## 2SLS ##现在我们使用2SLS来估计这种关系。我们使用z作为d的工具变量

第1阶段:在和上回归,并将d的拟合值保存为d。ddxxzz

tsls1

summary(tsls1)

##

## Call:

## lm(formula = d ~ x + z)

##

## Residuals:

## Min 1Q Median 3Q Max

## -2.59344 -0.52572 0.04978 0.53115 2.01555

##

## Coefficients:

## Estimate Std. Error t value Pr(>|t|)

## (Intercept) -0.01048 0.02383 -0.44 0.660

## x 0.01492 0.02296 0.65 0.516

## z 0.68594 0.02337 29.36 <2e-16 ***

## ---

## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

##

## Residual standard error: 0.7534 on 997 degrees of freedom

## Multiple R-squared: 0.4636, Adjusted R-squared: 0.4626

## F-statistic: 430.9 on 2 and 997 DF, p-value: < 2.2e-16

d.hat

第2阶段:在和上回归yyxxd.hatd.hat

tsls2

summary(tsls2)

##

## Call:

## lm(formula = y ~ x + d.hat)

##

## Residuals:

## Min 1Q Median 3Q Max

## -4.4531 -1.0333 0.0228 1.0657 4.0104

##

## Coefficients:

## Estimate Std. Error t value Pr(>|t|)

## (Intercept) 9.99507 0.04786 208.85 <2e-16 ***

## x 1.01609 0.04612 22.03 <2e-16 ***

## d.hat 1.00963 0.06842 14.76 <2e-16 ***

## ---

## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

##

## Residual standard error: 1.513 on 997 degrees of freedom

## Multiple R-squared: 0.4158, Adjusted R-squared: 0.4146

## F-statistic: 354.8 on 2 and 997 DF, p-value: < 2.2e-16

结果

b的真值:1 OLS estiamte of b:.00963 2SLS estiamte of b:1.31356

如果治疗变量是内生的,我们 使用2SLS。

如果您有任何疑问,请在下面发表评论。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/533122.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

计算机二级循环队列知识点,考点!计算机二级考试公共基础知识冲刺复习笔记:栈、队列和循环队列...

小编所收集到的相关计算机二级考试公共基础知识冲刺复习笔记&#xff1a;栈、队列和循环队列的资料 大家要认真阅读哦&#xff01;1、栈(Stack)又称堆栈。(1)栈是一种运算受限的线性表&#xff0c;其限制是仅允许在表的一端进行插入和删除运算。人们把此端称为栈顶&#xff0c;…

lua 字符串包含_Programming in Lualua学习第11期 Lua模块与包

微信公众号&#xff1a;GameToolDev关注可了解更多的游戏工具开发教程。问题或建议&#xff0c;请公众号留言;从Lua 5.1开始&#xff0c;我们可以使用require和module函数来获取和创建Lua中的模块。从使用者的角度来看&#xff0c;一个模块就是一个程序库&#xff0c;可以通过r…

学计算机优盘多少内存够用,u盘建议买多大内存的

大家好&#xff0c;我是时间财富网智能客服时间君&#xff0c;上述问题将由我为大家进行解答。u盘建议买多大内存主要看用途&#xff0c;一般容量为&#xff1a;1G、2G、4G、8G、16G、32G、64G、128G、256G、512G、1T&#xff0c;具体来说&#xff1a;1、如果是用来存放视频的&…

.net 从txt中读取行数据_【VBA项目】从指定文件中读取数据并绘制图表

VBA 是一种很久远的编程语言&#xff0c;但并不过时。在满足以下两个条件时&#xff0c;借助 VBA 可以极大的提升生产率&#xff0c;降低出错率&#xff1a;你的电脑上不允许自主安装软件&#xff1b; 你需要执行的工作中大部分的步骤都是固定且重复的。项目背景近期接到一个工…

本地摄像头应用到远程计算机,远程摄像头设置

可以的&#xff0c;智能家用监控摄像头&#xff0c;只要你手机有网&#xff0c;千里之外打开手机都可以查看视频&#xff0c;而且智能摄像头主要用于看家看孩子看老人照看猫猫狗狗等宠物的。智能摄像头&#xff0c;与市面上普通的事件录制不一样&#xff0c;它可以实现7*24小时…

axure实现复选框全选_jq简单的全选、反选和全不选效果

jquery是很实用和方便的前端效果库&#xff0c;可以让我减少很多的操作和节省很多的时间。今天&#xff0c;我们来说一下jq的全选、全不选和反选效果&#xff0c;本篇讲的是最简单简洁的jq全选、全不选和反选的例子。如果还有什么其他的功能要求可自己根据所学到的基础来扩展一…

计算机设备管理器驱动,设备管理器安装驱动程序的详细教程

系统出现问题&#xff0c;很多人都会选择重装系统。但系统重装后&#xff0c;我们所做的第一件事&#xff0c;就是安装驱动。有的驱动程序有安装包&#xff0c;直接安装就行了。但是有的驱动是只有驱动程序文件&#xff0c;而没有执行程序&#xff0c;这时候就需要通过设备管理…

ef执行原生sql语句_EF Core中执行原生SQL语句

一、课程介绍之所以今天录制这个系列文章的主要原因是&#xff0c;想在快速帮助到大家上手在ASP.NET Core WebAPI中结合EF Core来操作我们的数据库。EF Core的基础文章和基础课程实在是太多了&#xff0c;那么阿笨既然也来录制这个系列课堂&#xff0c;阿笨想必肯定会给大家带来…

华立学院计算机组成原理考试,广东工业大学华立学院计算机组成原理期末复习重点...

广工华立-2015-2016学年度-计算机组成原理考试复习一、考试题型&#xff1a;分为选择、判断、填空、简述题四大类。其中选择题有大约三分之一送分&#xff0c;大题占了50分、题目从课后作业出、重点大题为&#xff1a;指令方面&#xff1b;芯片连接&#xff1b;硬盘计算外存&am…

电路串联和并联图解_一个关于交流电路谐振现象的仿真实验

对于一个具有电阻、电感、电容的交流电路中&#xff0c;交流电源两端的电压一般不和它输出的电流同相位。如果调节电路的参数或者电源频率使它们同相位&#xff0c;这时电路就发生了谐振现象。按照发生谐振现象的电路不同&#xff0c;可以分为串联谐振和并联谐振。1、串联谐振在…

sync不生效 vue_Vue实战项目-记账器-重要知识点汇总

历时3周&#xff0c;记账器项目终于可以运行了&#xff0c;这次项目是基于Vue开发&#xff0c;用到了typeScript和Scss,下面基于项目做一个阶段性的总结&#xff0c;回顾一下项目中用到的知识点。一.组件一开始用的是JS对象的写法&#xff1a;构造选项&#xff1a;{ data(){ret…

开设计算机课程的必要性,学前教育专业开设计算机音乐制作课程的必要性与可行性...

学前教育专业开设计算机音乐制作课程的必要性与可行性李 萍430061【期刊名称】课程教育研究【年(卷),期】2012(000)020【总页数】1一、学前教育专业开设音乐相关课程的现状二、现代教育的新型特点&#xff0c;计算机音乐及制作的发展概况三、计算机音乐制作在学前教育专业开设的…

fifo页面置换算法设计思路_千万级并发!如何设计一个多级缓存系统?

什么是一个多级缓存系统?它有什么用?我们又如何设计一个多级缓存系统?图片来自 Pexels所谓多级缓存系统&#xff0c;就是指在一个系统的不同的架构层级进行数据缓存&#xff0c;以提升访问效率。我们都知道&#xff0c;一个缓存系统&#xff0c;它面临着许多问题&#xff0c…

广东省计算机学校哪所最好,广东省哪个技校比较好哪里好

湖北省有少数大中专院校在教育事业中&#xff0c;无论是投入还是创办教育学院&#xff0c;都比较好&#xff0c;的话就是至少能赚到三成。至于那些综合性、公益性大的院校&#xff0c;可能要好几千块钱不是问题&#xff0c;毕竟我们是艺术类的&#xff0c;所以毕竟整体上看&…

apple quicktime怎么在ppt中用_PPT情感专题大赏No. 007:一份这就是街舞第三季主题PPT(上集)...

Hello&#xff0c;大家好&#xff0c;这里是千师傅小作坊第35期&#xff0c;我是你们的老朋友千千。熟悉千师傅小作坊的人都知道&#xff0c;千师傅特别喜欢看综艺&#xff0c;尤其是音乐、表演、舞蹈类。作为一个十八线PPT设计师&#xff0c;如果我看到好看的节目视觉设计&…

计算机语言低下限高上限,学习语言有没有上限

学习语言有没有上限科学家普遍认为&#xff0c;语言是人类特有的认知天赋的一部分&#xff0c;所以长期以来&#xff0c;科学家一直在研究疾病和创伤如何削弱语言能力。但是&#xff0c;直到现在&#xff0c;科学家仍不清楚一个人最多能掌握多少种语言。在经过长期沉默后&#…

idea内存溢出解决_各种OOM代码样例及解决方法

针对目前大家对OOM的类型不太熟悉&#xff0c;那么来总结一下各种OOM出现的情况以及解决方法。把各种OOM的情况列出来&#xff0c;然后逐一进行代码编写复现和提供解决方法。1. 堆溢出-java.lang.OutOfMemoryError: Java heap space。2. 栈溢出-java.lang.OutOfMemorryError。3…

win7安装硬盘后无法启动计算机,硬盘装Win7系统电脑后开机提示DISK BOOT FAILURE怎么办【图文】...

很多人都喜欢安装win7系统&#xff0c;而硬盘安装系统的方式也是深受用户们的喜欢&#xff0c;但是最近有用户反映说硬盘安装win7系统之后&#xff0c;在重启计算机的时候屏幕提示DISK BOOT FAILURE,INSERT SYSTEM DISK AND PRESS ENTER&#xff0c;导致无法正常进入系统&#…

导入数据中文乱码_基于Navicat和Kettle的数据迁移完全解读(多图)

需求描述对于数据分析人员来说&#xff0c;工作的基础是数据&#xff0c;没有数据分析就无从谈起&#xff0c;即巧妇难为无米之炊。#数据库# #数据迁移# #Oracle# 然而&#xff0c;数据分析往往在实验环境或者准生产环境中开展&#xff0c;而数据分布在生产环境&#xff0c;因此…

怎样能确保计算机安全,如何确保电脑安全

如何确保电脑安全电脑安全问题层出不穷&#xff0c;如何确保电脑安全呢?下面是小编分享的一些方法&#xff0c;一起来看一下吧。一、关闭默认共享大部分的电脑系统在默认的情况下都是自动开启网络共享设置的&#xff0c;Win7系统也不例外&#xff0c;该功能主要是为了用户能够…