r语言 面板数据回归_R语言_018回归

  回归分析是统计学的核心。它其实是一个广义的概念,指那些用一个或多个预测变量来预测响应变量的方法。通常,回归分析可以用来挑选与响应变量相关的解释变量,可以描述两者的关系,也可以生成一个等式,通过解释变量来预测响应变量。

  下面介绍如何用R函数拟合OLS回归模型、评价拟合优度、检验假设条件以及选择模型,为了能够恰当地解释OLS模型的系数,数据必须满足以下统计假设↓

  • 正态性:对于固定的自变量值,因变量值成正态分布。

  • 独立性:Yi值之间相互独立。

  • 线性:因变量与自变量之间为线性相关。

  • 同方差性:因变量的方差不随自变量的水平不同而变化。也可称作不变方差,但是说同方差性感觉上更犀利。

  如果违背了以上假设,统计显著性检验结果和所得的置信区间就很可能不精确了。而现在机器学习中的回归都完全忽略了这一点,它认为现在的数据都是大数据了,其实,很多时候我们得到的不是所谓的大数据。

  在R中,拟合线性模型最基本的函数就是lm(),格式为:

fit 

  其中,formula指要拟合的模型形式,data是一个数据框,包含了用于拟合模型的数据。结果对象存储在一个列表中,包含了所拟合模型的大量信息。

表达式(formula)形式如下↓

Y ~ X1 + X2 + ... + Xk

~ 左边为响应变量,右边为各个预测变量,预测变量之间用 + 符号分隔。

  拟合模型后,将这些函数应用于lm()返回的对象,可以得到更多额外的模型信息。

summary():展示拟合模型的详细结果coefficients():列出拟合模型的模型参数(截距项和斜率)confint():提供模型参数的置信区间(默认95%)fitted():列出拟合模型的预测值residuals():列出拟合模型的残差值anova():生成一个拟合模型的方差分析表,或者比较两个或更多拟合模型的方差分析表vcov():列出模型参数的协方差矩阵AIC():输出赤池信息统计量plot():生成评价拟合模型的诊断图predict():用拟合模型对新的数据集预测响应变量值

  当回归模型包含一个因变量和一个自变量时,我们称为简单线性回归。

  当只有一个预测变量,但同时包含变量的幂时,我们称为多项式回归。

  当有不止一个预测变量时,则称为多元线性回归。

  先从一个简单的线性回归例子开始,然后逐步展示多项式回归和多元线性回归↓

【简单线性回归】

  数据准备,数据还是模拟电商的交易数据。

setwd("E:/R/基础/data")library(xlsx)df = read.xlsx("模拟相关数据.xlsx",1,encoding = "UTF-8")

b60cee6caab3f3877bc3f1f7bc295982.png

fit summary(fit)

6f902f50f29c46d66c1368700d9e5562.png

  通过输出结果,可以得到预测等式:每日订单数=19.4+0.0236*每日UV数,相当于,每增加42个UV数,就能带来一个新的订单。因为没有用户登录就不可能有订单,所以没必要给截距项一个物理解释,它仅仅是一个常量调整项;在Pr(>|t|)栏,可以看到回归系数显著不为0(p<0.001);R平方项(0.6987)表明模型可以解释69.87%的方差,它也是实际和预测值之间相关系数的平方;

拟合模型的预测值

fitted(fit)

f9b9c1e30494001ff047fefccceaae94.png

拟合模型的残差值

residuals(fit)

2a0462dacebecb738eb4d7cdee672188.png

plot(df$UV,df$订单数,     xlab="每日UV数",     ylab="每日订单数")abline(fit,col='red',lwd=2)

67e04ea597cfaefae543d94620196c62.png

【多项式回归】

fit2               data=df)

  I(UV^3) 表示向预测等式添加一个UV的立方项。先试了一下平方项,发现3次项拟合效果更好。

2e62f5833c7bf3cf4d87b01d2d8fe7e2.png

  新的预测等式为:每日订单数=68.32+9.602e-03*每日UV数+1.389e-10*每日UV数的平方。

plot(df$UV,df$订单数,     xlab="每日UV数",     ylab="每日订单数")lines(df$UV,fitted(fit2),col='#0AC941',lwd=2)

9569f1aba4ca3bd89044762478c87e21.png

【多元线性回归】

  当预测变量不止一个时,简单线性回归就变成了多元线性回归,分析也稍微复杂些。多元回归分析中,第一步最好检查一下变量间的相关性。cor()函数提供了二变量之间的相关系数,car包中scatterplotMatrix()函数则会生成散点图矩阵。scatterplotMatrix() 函数默认在非对角线区域绘制变量间的散点图,并添加平滑和线性拟合曲线。对角线区域绘制每个变量的密度图和轴须图。

df1 cor(df1)

a781317c8b31550c97530fbfadd40000.png

f870d17ca61585ff2de95594e338d1e3.png

使用lm()函数拟合多元线性回归模型

fit           data=df)summary(fit)

d60722e7fe5449eac9fa9b6f340850ad.png

  可以看到,影响销售金额的主要因素是订单数、单均价和卖家数量。而这里显示UV和转化率对销售金额影响不显著,这明显是不符合常理的。而UV和转化率对订单数影响很显著,然后通过订单数影响销售金额。

fit1               data=df)summary(fit1)

ba137efc53b50efc87523c8ee56737dd.png

结果是这样↓

  每增加一笔订单,金额增加356元;

  单均价增加1元,金额增加116元;

  卖家数量增加1家,金额增加489元。

  卖家数量增加很难,就要想办法增加订单数和单均价,而订单数与UV和转化率关系很大,UV数每增加1000个,订单数可以增加24个,金额增加8544万元;而转化率每增加0.1%,订单数增加418笔。

  所以拉新、留存很重要,运营也很重要。

94a920d09b4c3e9e0cce5c753d1c6b8a.gif

End

28b30415b8b9726b508ea05a7352a14b.gif

◆ R语言分词_jiebaR包◆ R语言_TreeMap◆ R_脸谱图

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/271462.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Integer对象范围(-128-127)之间(Integer. valueOf()方法)

1.Integer. valueOf()方法的作用 Integer. valueOf()可以将基本类型int转换为包装类型Integer&#xff0c;或者将String转换成Integer&#xff0c;String如果为Null或“”都会报错 看下面代码示例 取值为127时 取值为128时 为什么会是这样呢&#xff1f; 首先&#xff0c;我们…

操作系统基础:进程知识笔记(三)

1、死锁概念知识 计算机中存在许多互斥资源&#xff08;打印机&#xff09;、软件资源&#xff08;进程表、临界区&#xff09;如果两个进程同时调用打印机&#xff0c;或同时进入临界区必然会出现问题。 死锁&#xff1a;指两个以上的进程互相要求对方已经占有的资源导致无法继…

垂直梯形校正画质损失多少_梯形校正功能是怎么实现的?其中可大有学问

梯形校正这个概念&#xff0c;想必大部分投影仪用户早已耳熟能详。所谓的梯形校正&#xff0c;指的是当我们的投影仪位置摆放不正时&#xff0c;投射出来的画面会是一个梯形&#xff0c;这时候需要通过投影仪的梯形校正功能将画面调整为可以正常观看的矩形。虽然目前市场上的大…

操作系统基础:存储管理知识笔记(一)

1、存储器基础知识 存储器管理的对象是主存或内存&#xff0c;存储器是计算机系统中非常关键的资源&#xff0c;用来存放各种信息的主要场所。存 储器管理功能主要包括&#xff1a;主存空间的分配和回收、提供主存利用率、扩充主存、主存信息的保护。 2、存储器结构 存储器结构…

asp点击按钮sql列求和_助你2020晋级互联网大数据阵营(一):轻轻松松学SQL

毫不负责任的说&#xff0c;你和数据科学家最大的鸿沟&#xff0c;就差一个SQL语言&#xff1a;)入门后&#xff0c;后面的事情就简单了为了帮大家尽快入门Hive SQL、学会提数和分析&#xff0c;实现在大数据领域大干一场的愿望&#xff0c;帮你准备好了数据&#xff0c;准备好…

幂等和高并发在电商系统中的使用

在Java web项目开发中&#xff0c;经常会听到在做订单系统中生成订单的时候&#xff0c;要做幂等性控制和并发控制&#xff0c;特对此部分内容作出总结&#xff0c;在高并发场景下&#xff0c;代码层面需要实现并发控制&#xff1b;但是幂等性&#xff0c;其实更多的是系统的接…

@transactional注解失效情况

先来了解一下Transactional注解事务的特性吧&#xff0c;可以更好排查问题 1、service类标签(一般不建议在接口上)上添加Transactional&#xff0c;可以将整个类纳入spring事务管理&#xff0c;在每个业务方法执行时都会开启一个事务&#xff0c;不过这些事务采用相同的管理方…

计算机c盘隐藏了怎么办,win7怎么隐藏c盘 win7c盘被隐藏了怎么解除

很多的电脑用户担心其他用户在使用电脑时修改c盘中的重要文件&#xff0c;所以会将c盘设置为隐藏&#xff0c;那么大家知道在win7系统中怎么隐藏c盘吗?方法很简单&#xff0c;下面小编为大家带来win7隐藏c盘的详细教程&#xff0c;不知道怎么隐藏的朋友可以查看下面的教程学习…

操作系统基础:存储管理知识笔记(二)

一、分页存储管理 1、分页存储管理介绍 1.1 分页原理 页&#xff1a;将一个进程的地址空间划分为若干个大小相等的区域称为页。 块、页框&#xff1a;主存空间划分成与页相同的若干个物理块。 1.2 地址结构 分页系统地址结构&#xff1a;前一部分为页号&#xff1b;后一部分为页…

人工智能 信道估计 深度学习_DEMO演示|基于IVP02D 人工智能工作站的深度学习引擎,实现人群热力估计...

近年来&#xff0c;随着深度学习在计算机视觉领域获得广泛应用&#xff0c;算法框架也日渐成熟&#xff0c;例如基于深度神经网络的人群密度分析&#xff0c;通过自动学习能获得更有效的人群特征&#xff0c;相较于传统方法取得了一定的提高。AI小知识人群密度分析&#xff08;…

vscode kite插件_微软发布 VS Code Python 插件 7 月更新

微软发布了 7 月的 Visual Studio Code Python 扩展更新&#xff0c;此版本总共修复了 51 个问题&#xff0c;其中包括&#xff1a;支持新的语言服务器&#xff1a;PylanceGather 扩展将 Notebook 导出为 HTML 和 PDF调试器的反向连接支持新的语言服务器&#xff1a;PylancePyl…

360浏览器打不开微信的连接服务器,上午还能打开,下午360浏览器打不开微信公 – 手机爱问...

2011-08-27ie&#xff0c;搜狗&#xff0c;谷歌浏览器都打不开&#xff0c;说打不开ipad说服务器超时是新浪在更新设备吗&#xff1f;一般你能进入爱问就可以进入邮箱&#xff0c;下面的方法看看(如果你是铁通的可能是铁通的问题)。可能是服务器故障引起的&#xff0c;请不要着…

域名还能绑定动态IP?看完又涨知识了!!

点击上方蓝色“冰河技术”&#xff0c;关注并选择“设为星标”持之以恒&#xff0c;贵在坚持&#xff0c;每天进步一点点&#xff01;作者个人研发的在高并发场景下&#xff0c;提供的简单、稳定、可扩展的延迟消息队列框架&#xff0c;具有精准的定时任务和延迟队列处理功能。…

java 及时释放内存_JMM(一):初识Java内存模型

在并发编程中&#xff0c;线程之间的通信是一个很关键的问题&#xff0c;而该问题解决方案主要可分为两大类&#xff1a;消息传递、共享内存。前者有以Erlang语言为代表的Actor模型&#xff0c;而后者中典型的则是Java语言。对于消息传递机制而言&#xff0c;线程之间必须通过发…

电脑维修知识:电脑常见故障维修大全及解决方法

电脑已经成为我们学习生活娱乐必不可少的设备了&#xff0c;用得时间久了难免会遇到小故障&#xff0c;今天我们一起来看下遇到常见的电脑方面的小故障&#xff0c;我们应该如何去自己检测和维修吧。电脑检测故障我们还是要从电脑的几大硬件开始检查起。1、CPU打开机箱查看CPU风…

工程图样中粗实线的用途_图纸天天画,粗实线和细实线的线宽比例是多少?2:1还是3:1?...

点击上方头条号“机械设计一点通”关注我们&#xff0c;每天学习一个机械设计相关知识点我们知道&#xff1a;机械制图中为了表示不同内容&#xff0c;并能分清主次&#xff0c;必须使用不同线型。图线的线型由线宽和线素长度等构成&#xff0c;机械制图中各种线型都有相应宽度…

STM32F4_USART配置及细节描述

Ⅰ、概述 关于USART串口通信&#xff0c;可以说是MCU的标配。不管是在实际项目应用中&#xff0c;还是在开发过程中&#xff0c;它都起着很重要的作用。 在项目应用中我们常常使用UART串口进行通信&#xff0c;根据通信的距离及稳定性&#xff0c;还选择添加RS232、RS485等对UA…

腾讯面试:SaaS多租户,如何设计?

尼恩说在前面 在40岁老架构师 尼恩的读者交流群(50)中&#xff0c;最近有小伙伴拿到了一线互联网企业网易、美团、字节、如阿里、滴滴、极兔、有赞、希音、百度、美团的面试资格&#xff0c;遇到很多很重要的面试题&#xff1a; 多租户设计&#xff0c;如何 技术选型&#xff…

Mac中Finder是什么?怎么打开?

很多人都知道windows系统中的资源管理器&#xff0c;不过不知道什么是finder。finder和资源管理器一样&#xff0c;都是用来管理文件&#xff0c;finder存在于mac统中&#xff0c;那么finder有什么作用呢?下面下班就为大家分享关于mac系统中finder的相关内容。   1、怎么打开…

phpstudy页面不存在_网站的404页面对于SEO的重要作用

随着网站建设的需求和要求越来越多&#xff0c;网站的新形式也逐渐成为人们改版的方向&#xff0c;但是在网站的改版中难免会出现一些小差错&#xff0c;导致网站的运行不顺畅&#xff0c;这很有可能就是网站建设中忘记设计404页面&#xff0c;那么4040页面能给网站带来哪些好处…