R学习-小白笔记05


----回归诊断----
#样本是否符合正态分布假设?
#是否存在离群值导致模型产生较大误差?
#线性模型是否合理?
#误差是否满足独立性,等方差,正态分布等假设条件?
#是否存在多重共线性?

 


----正态分布检验----
#正态性检验:函数shapiro.test()
#P>0.05,正态性分布

#数据来源
>num=seq(10378001,10378100);num
>x1=round(runif(100,min=80,max=100));x1#均匀分布产生
>x2=round(rnorm(100,mean=80,sd=7));x2
>x3=round(rnorm(100,mean=83,sd=18));x3
>x3[which(x3>100)]=100;x3
>x=data.frame(num,x1,x2,x3);x

>shapiro.test(x$x1)
Shapiro-Wilk normality test

data: x$x1
W = 0.94894, p-value = 0.0007066 #P值很小说明统计学意义明显,因此拒绝假设,说明x1不是正态分布产生的

>shapiro.test(x$x2)
Shapiro-Wilk normality test

data: x$x2
W = 0.97989, p-value = 0.1302 #P值不具备统计学意义,因此不能拒绝假设,不能说明x2不是正态分布

 


----散点图目测检验----
#薛毅 例6.11

 


----残差----
#残差计算函数residuals()
#对残差做正态性检验
#残差图
薛毅 例6.14 标准化残差图

 


----多重共线性----
#什么是多重共线性?
#多重共线性对回归模型的影响?--求逆矩阵会变得不稳定
#利用计算特征根发现多重共线性
#Kappa()函数

薛毅 例6.18
#读入数据
>collinear<-data.frame(
  Y=c(10.006, 9.737, 15.087, 8.422, 8.625, 16.289,
    5.958, 9.313, 12.960, 5.541, 8.756, 10.937),
  X1=rep(c(8, 0, 2, 0), c(3, 3, 3, 3)),
  X2=rep(c(1, 0, 7, 0), c(3, 3, 3, 3)),
  X3=rep(c(1, 9, 0), c(3, 3, 6)),
  X4=rep(c(1, 0, 1, 10), c(1, 2, 6, 3)),
  X5=c(0.541, 0.130, 2.116, -2.397, -0.046, 0.365,
    1.996, 0.228, 1.38, -0.798, 0.257, 0.440),
  X6=c(-0.099, 0.070, 0.115, 0.252, 0.017, 1.504,
    -0.865, -0.055, 0.502, -0.399, 0.101, 0.432))
#自变量的共线性分析
>XX<-cor(collinear[2:7])
#求k值
>kappa(XX,exact=TRUE)
[1] 2195.908 #k=2195.908>1000,认为有严重的多重共线性
#找出哪些变量是多重共线性的,因此需计算矩阵的特征值和相应的特征向量
>eigen(XX)
$values
[1] 2.428787365 1.546152096 0.922077664 0.793984690 0.307892134 0.001106051

$vectors
[,1] [,2] [,3] [,4] [,5] [,6]
[1,] -0.3907189 0.33968212 0.67980398 -0.07990398 0.2510370 -0.447679719
[2,] -0.4556030 0.05392140 -0.70012501 -0.05768633 0.3444655 -0.421140280
[3,] 0.4826405 0.45332584 -0.16077736 -0.19102517 -0.4536372 -0.541689124
[4,] 0.1876590 -0.73546592 0.13587323 0.27645223 -0.0152087 -0.573371872
[5,] -0.4977330 0.09713874 -0.03185053 0.56356440 -0.6512834 -0.006052127
[6,] 0.3519499 0.35476494 -0.04864335 0.74817535 0.4337463 -0.002166594

得到:
λmin = 0.001106, ϕ = (0.4476, 0.4211, 0.5417, 0.5734, 0.006052, 0.002167)T
即,
0.4476x(1) + 0.4211x(2) + 0.5417x(3) + 0.5734x(4)+ 0.006052x(5) + 0.002167x(6) ≈ 0
由于x(6)和x(5)前的系数近似于0,因此将其去掉:
0.4476x(1) + 0.4211x(2) + 0.5417x(3) + 0.5734x(4) ≈ 0
所以存在,c0,c1,c2,c3,c4使得
c1X1 + c2X2 + c3X3 + c4X4 ≈ c0
因此说明X1,X2,X3,X4存在多重共线性

 


----广义线性模型----
薛毅 例6.19
#目标:求出电流强度与牛是否张嘴之间的关系
#困难:牛是否张嘴,是0-1变量,不是变量,无法建立线性回归模型
#矛盾转化:牛张嘴的概率是联续变量
>a=c(0;5)
>b=c(0,0.129,0.3,0.671,0.857,0.9)
>plot(a,b)#根据图片可以看出符合logistic回归模型的曲线特征
#广义线性模型建模函数:glm()
fm <- glm(formula, family = binomial(link = logit),data=data.frame)

#数据框形式输入数据
>norell<-data.frame(x=0:5, n=rep(70,6), success=c(0,9,21,47,60,63))
#构造矩阵
>norell$Ymat<-cbind(norell$success, norell$n-norell$success)
#建模
>glm.sol<-glm(Ymat~x, family=binomial, data=norell)
>summary(glm.sol)

Call:
glm(formula = Ymat ~ x, family = binomial, data = norell)

Deviance Residuals:
1 2 3 4 5 6
-2.2507 0.3892 -0.1466 1.1080 0.3234 -1.6679

Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) -3.3010 0.3238 -10.20 <2e-16 ***
x 1.2459 0.1119 11.13 <2e-16 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

(Dispersion parameter for binomial family taken to be 1)

Null deviance: 250.4866 on 5 degrees of freedom
Residual deviance: 9.3526 on 4 degrees of freedom
AIC: 34.093

Number of Fisher Scoring iterations: 4

 


----非线性模型----
#例子:销售额×流通费率y
>x=c(1.5,2.8,4.5,7.5,10.5,13.5,15.1,16.5,19.5,22.5,24.5,26.5)
>y=c(7.0,5.5,4.6,3.6,2.9,2.7,2.5,2.4,2.2,2.1,1.9,1.8)
>plot(x,y)#非线性
----------------------------------
#直线回归(R²值不理想)
----------------------------------
>lm.1=lm(y~x)
>summary(lm.1)

Call:
lm(formula = y ~ x)

Residuals:
Min 1Q Median 3Q Max
-0.9179 -0.5537 -0.1628 0.3953 1.6519

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 5.60316 0.43474 12.889 1.49e-07 ***
x -0.17003 0.02719 -6.254 9.46e-05 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 0.7701 on 10 degrees of freedom
Multiple R-squared: 0.7964, Adjusted R-squared: 0.776
F-statistic: 39.11 on 1 and 10 DF, p-value: 9.456e-05

---------------------------
#对数法,y=a+blogx
----------------------------
>lm.log=lm(y~log(x))
>summary(lm.log)

Call:
lm(formula = y ~ log(x))

Residuals:
Min 1Q Median 3Q Max
-0.33291 -0.10133 -0.04693 0.16512 0.34844

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 7.3639 0.1688 43.64 9.60e-13 ***
log(x) -1.7568 0.0677 -25.95 1.66e-10 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 0.2064 on 10 degrees of freedom
Multiple R-squared: 0.9854, Adjusted R-squared: 0.9839
F-statistic: 673.5 on 1 and 10 DF, p-value: 1.66e-10

>plot(x,y)
>lines(x,fitted(lm.log))y(lm.log)

--------------------------
#指数法,y=ae(bx)
--------------------------
>lm.exp=lm(log(y)~x)
>summary(lm.exp)

Call:
lm(formula = log(y) ~ x)

Residuals:
Min 1Q Median 3Q Max
-0.18246 -0.10664 -0.01670 0.08079 0.25946

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 1.759664 0.075101 23.43 4.54e-10 ***
x -0.048809 0.004697 -10.39 1.12e-06 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 0.133 on 10 degrees of freedom
Multiple R-squared: 0.9153, Adjusted R-squared: 0.9068
F-statistic: 108 on 1 and 10 DF, p-value: 1.116e-06

>plot(x,y)
>lines(x,exp(fitted(lm.exp)))

---------------------------
#幂函数法,y=ax(b)
---------------------------
>lm.pow=lm(log(y)~log(x))
>summary(lm.pow)

Call:
lm(formula = log(y) ~ log(x))

Residuals:
Min 1Q Median 3Q Max
-0.054727 -0.020805 0.004548 0.024617 0.045896

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 2.19073 0.02951 74.23 4.81e-15 ***
log(x) -0.47243 0.01184 -39.90 2.34e-12 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 0.0361 on 10 degrees of freedom
Multiple R-squared: 0.9938, Adjusted R-squared: 0.9931
F-statistic: 1592 on 1 and 10 DF, p-value: 2.337e-12
>plot(x,y)
>lines(x,exp(fitted(lm.pow)))

**对比以上各种拟合回归过程得出结论是幂函数法为最佳

-----------------------
#多项式回归模型
-----------------------
#正交多项式回归
#缺点:容易导致过拟合情况,或者拟合不足的情况

 


----非线性最小二乘问题----
#nls()函数
薛毅 例子6.23

 



 

转载于:https://www.cnblogs.com/EleanorInHarbin/p/8268439.html

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/267749.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

入门笔记(启动篇)

linux启动过程&#xff1a; bios自检&#xff0d;&#xff0d;&#xff1e;MRB&#xff0d;&#xff0d;&#xff1e;GRUB&#xff0d;&#xff0d;&#xff1e;内核加载&#xff0d;&#xff0d;&#xff1e;INIT&#xff0d;&#xff0d;&#xff1e; /etc/i…

乌班图 之 常用操作命令(二)

一、tree命令 tree [目录名]  以树状图列出文件目录 -d 只显示目录&#xff0c;不显示文件。 二、cp命令 cp即copy   cp 源文件 目标文件 -i  重名自动 覆盖 加了 -i 提示   y/n -r  复制目录及该目录下所有字目录和文件&#xff0c;目标文件必须是一个目录名。 三、…

php 对比两个压缩包内容,php实现的zip文件内容比较类

本文实例讲述了php实现的zip文件内容比较类。是一个非常实用的PHP类文件。分享给大家供大家参考。具体分析如下&#xff1a;该php zip文件比较类主要实现比较两个zip文件的内容&#xff0c;返回新增&#xff0c;删除&#xff0c;及相同的文件列表。暂时只支持单层。需求&#x…

Exchange2010外部传输域的使用方法

安装好EX2010后并不能马上与外部邮件进行收发&#xff0c;需要进行以下几个配置&#xff1a; 1、配置接收连接器 2、配置接受域 3、配置发送连接器 可以参考这个链接&#xff1a;http://www.chinaemail.com.cn/server/xtfl/Exchange/201101/59114.html 下面以我的实例来说明一…

Shiro安全框架入门篇

一、Shiro框架介绍 Apache Shiro是Java的一个安全框架&#xff0c;旨在简化身份验证和授权。Shiro在JavaSE和JavaEE项目中都可以使用。它主要用来处理身份认证&#xff0c;授权&#xff0c;企业会话管理和加密等。Shiro的具体功能点如下&#xff1a; &#xff08;1&#xff09;…

php 京东首页分类导航,仿京东导航栏

摘要&#xff1a; 仿京东顶部导航栏 仿京东顶部导航栏*{margin:0px;padding:0px;}.header{width:100%;height:35px;background-color:#E3E4E5;}.header_content{width:1200px;height:35px;margin:auto;padding:0px;}.header_left{width:300px;height:35px;line-height:35px…

asp.net ajax1.0基础回顾(七):综合应用

本文将通过学生信息管理来介绍asp.net ajax的综合应用实例&#xff0c;包括“浏览”、“查询”、“添加”和“多选删除”功能&#xff0c;以及其它相关设计。 本示例源代码下载地址&#xff1a;http://down.51cto.com/data/220541 本示例中&#xff0c;程序架构参考Petshop&…

探讨程序员如何学习你不熟悉的技术,以及用什么样的方法去学习.

由于公司的业务拓展&#xff0c;有一部份的程序要用Delphi来实现&#xff08;基于原来的程序拓展&#xff09;现在需要学习Delphi&#xff0c;刚开始接手时感觉不知如何下手&#xff08;也许是本人才疏学浅&#xff09;&#xff0c;于是在网上找了很多资料&#xff0c;总是感觉…

转载:关于对REST的基本认识和理解

1.什么是 REST?REST 是属于 WEB 自身的一种架构风格&#xff0c;是在 HTTP 1.1 规范下实现的。Representational State Transfer 全称翻译为表现层状态转化。Resource&#xff1a;资源。比如 newsfeed&#xff1b;Representational&#xff1a;表现形式&#xff0c;比如用JSON…

php ajax取不到值,PHP没有从Ajax获取值

我一直在搜索所有的答案&#xff0c;但我无法让它工作。我想从ajax发送两个整数值到php。这是ajax部分&#xff1a;$(document).ready(function(){$(input[type"radio"]).click(function(){var id_user$(this).filter(:checked).val();var stringname$(this).attr(na…

ASP.NET MVC3书店--第五节 表单编辑(第二部分)(转)

http://blog.sina.com.cn/s/blog_6ad539a90100r469.html5.5 使用HTML帮助器来截短文字 使用我们的StoreManager控制器中的Index方法添加视图的时候&#xff0c;有一个潜在的问题。事实上&#xff0c;我们的书名与作者名属性的长度值可能超出页面上 所定义的这两个列的长度。我们…

SSL-ZYC 1760 商店选址问题

题目大意&#xff1a; 给出一个城市的地图&#xff0c;商店设在一点&#xff0c;使各个地方到商店距离之和最短。 思路&#xff1a; 这是一道最短路的问题。a[i][j]表示从i到j的最短路径&#xff0c;最终求出最小值并输出。 代码&#xff1a; #include <cstdio> #incl…

c++ java通信 protocol buffer,google protocol buffer (C++,Java序列化应用实例)

google protocol buffer (C,Java序列化使用实例)转载,请注明出处: http://blog.csdn.net/eclipser1987/article/details/8525383 (eclipser163.com)1.下载安装:google protocol buffer 的官网地址是:http://code.google.com/p/protobuf/建议下载稳定版本:protobuf-2.4.1 linu…

hadoop等的下载地址

有的时候要使用老的版本hadoop,找不到地方下载,保存连接如下http://archive.apache.org/dist/hadoop/core/http://archive.cloudera.com/cdh/3/

前端“黑话”polyfill

前言 在Web前端开发这个日新月异的时代&#xff0c;总是需要阅读一些最新的英文技术博客来跟上技术的发展的潮流。而有时候会遇到一些比较高频的“黑话”&#xff0c;在社区里面可能已经是人人皆知的“共同语言”&#xff0c;而你接触的少就偏偏看不懂。就像现在几乎所有中国人…

java 什么是线程同步,java多线程同步集合是什么?并发集合是什么?

java中关于集合的内容也是十分丰富的&#xff0c;而且相关的知识点也是十分多的。多线程集合所涵盖的范围是十分广阔的。今天就来为大家介绍一下&#xff0c;java多线程同步集合是什么以及并发集合是什么?一起来看看吧。首先我们需要知道的是&#xff0c;无论是同步集合还是并…

windwos 批处理重定向, 讲的策彻底

本帖主要参考了《命令行参考》和一些前辈的文献&#xff0c;并加入了我自己的一些理解&#xff0c;希望能对各位有所帮助。 《命令行参考》中对重定向操作符有所论述&#xff0c;不过实在晦涩难懂&#xff0c;并且还有些错误&#xff0c;不利于大家理解。重定向的简单用法相信大…

matlab里符号的写法,Matlab中特殊符号的写法

Matlab的figure中输入上标、下标、特殊符号或字体坐标轴标注&#xff1a;1. 控制坐标轴尺度长度&#xff1a;set(gca,XLim,[-pi/2 pi])2. 定制自己想标注的刻度&#xff1a;(1)set(gca,XTick,[-pi/2:pi/4:pi])(2)set(gca,XTickLabel,{-pi/2 -pi/4: 0 pi/4 pi/2 pi*3/4 pi})3. 反…

VB.NET怎样开发自定义Windows控件

前言 Microsoft&reg; Visual Basic&reg; 的组件支持历来都是它的一大卖点&#xff0c;于是第三方软件开发商们纷纷开发出各种具有新功能性的可视控件 (也有少数非可视控件) 供 Visual Basic 程序员选用。这种特殊的 Visual Basic 开发形式创造了无数的第三方控件——有…

内核配置

make config&#xff1a;基于文本模式的交互式配置。 make menuconfig&#xff1a;基于文本模式的菜单型配置。&#xff08;推荐使用&#xff0c;空格键选择&#xff1a;*&#xff1a;y&#xff0c;M:M,空格&#xff1a;N&#xff09; make oldconfig&#xff1a;使用已有的配置…