回归分析中的异方差性

在简单线性回归或多元线性回归中,我们对误差项做了一些基本假设。

简单线性回归:
在这里插入图片描述
多元线性回归:
在这里插入图片描述

假设条件:

1.误差均值为零
2.误差具有恒定方差
3.误差不相关
4.误差呈正态分布

第2个假设称为同方差性,因此,违反这个假设称为异方差性。

同方差vs异方差

在这里插入图片描述

因此,简单地说,我们可以将异方差定义为回归模型中误差项或残差项的方差发生变化的条件。正如你在上图中看到的,在同方差的情况下,数据点是均匀分散的,而在异方差的情况下,数据点不是均匀分散的。

产生异方差的可能原因:

  1. 通常发生在最大和最小观测值之间有很大范围的数据集中,即当有异常值时。
  2. 未正确指定模型时。
  3. 如果观察结果与不同的尺度度量混合。
  4. 当使用不正确的数据转换来执行回归时。
  5. 偏度是回归量分布中的一种,也可能是其他一些来源。

异方差的影响:

  • 如上所述,线性回归的假设之一(假设2)是不存在异方差。打破这个假设意味着OLS(普通最小二乘)估计量不是最佳线性无偏估计量(BLUE),并且它们的方差不是所有其他无偏估计量中最低的。
  • 估计器不再是最佳/有效的。
  • 由于估计的回归系数的协方差矩阵的不一致性,假设检验(如t检验、F检验)不再有效。

用残差图识别异方差:

如前文所示,异方差在残差图中产生向外开口的漏斗或向外闭合的漏斗形状。

通过统计检验识别异方差:

异方差的存在也可以使用算法方法进行量化。有一些统计检验或方法可以用来确定异方差的存在或不存在。

  • Breusch-Pagan测试:它测试回归误差的方差是否依赖于自变量的值。在这种情况下,存在异方差性。
  • White 检验:White 检验确定回归模型中误差的方差是否为常数。为了检验恒定方差,我们进行辅助回归分析:这将来自原始回归模型的平方残差回归到包含原始回归量及其平方和叉积的一组回归量上。

异方差修正:

  1. 我们可以使用不同规范的模型。
  2. 加权最小二乘法是常用的统计方法之一。这是普通最小二乘和线性回归的推广,其中允许误差协方差矩阵不同于单位矩阵。
  3. 使用MINQUE:Minimum Norm Quadratic Unbiased Estimation(MINQUE)的理论包括三个阶段。首先,定义一个一般类的潜在的估计作为二次函数的观测数据,其中的估计涉及到一个向量的模型参数。其次,指定某些约束的估计量的期望属性,如无偏性。第三,选择最佳的估计量通过最小化的“范数”的大小的协方差矩阵的估计。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/694549.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

行李电子秤解决方案

在生活中,买菜时常常出现缺斤少两的情况,这种情况多是商家秤有很大问题,往往消费者是最吃亏的,这种情况下,我们最好是带个吊钩电子秤,测量菜的重量,有问题直接拨打举报电话举报商家,…

py2neo和neo4j

py2neo 和 neo4j 是两个 Python 中与 Neo4j 图数据库交互的库,但它们有不同的设计和使用方式。 py2neo: 类型: py2neo 是一个面向对象的库,提供了一个对象模型,使得与 Neo4j 数据库的交互更加 Pythonic。API 风格: 使用 Node 和 Relationship…

基于SSM实现的人事管理系统(源代码+数据库脚本)

文章目录 系统介绍技术选型成果展示账号地址及其他说明源码获取 系统介绍 系统演示 微信视频号:【全栈小白】查看视频 基于SSM实现的人事管理系统使用JavaEE开发,基于SpringMVCMybatis框架,该项目包含了用户管理、部门管理、职位管理、员工…

拯救者Legion Y9000K 2021H(82K6)原厂oem预装Win11系统镜像

lenovo联想拯救者Y9000K(82K6)原装出厂Windows11系统安装包下载,恢复出厂开箱状态 链接:https://pan.baidu.com/s/1DGWU7gctJerff6LJrgHD5w?pwdrbs5 提取码:rbs5 原装出厂系统自带所有驱动、出厂主题壁纸、系统属性联机支持标志、Office…

Linux桌面

系统信息的截图 登录界面右下角可以切换 Ubuntu on Wayland ,虽然还是测试版,不过体验已经比之前的 Xorg 好多了,最笔记本上使用最影响体验的高分屏适配功能,在 wayland 中也是几乎完美支持的。 卸载 snap 这个 snap 是 Ubuntu …

WEB 3D技术 three.js 3D贺卡(4) 添加鼠标滚轮移动屏幕 改变贺卡文字功能

好,上文 WEB 3D技术 three.js 3D贺卡(3) 点光源灯光动画效果 那么 我们来做一下 鼠标滚动相机和滚动时不同文字的切换 首先 我们要设置多个场景 其实也不能完全叫场景 也可以说多个位置 反正简单说就是多个位置 展现多个场景 我们先在代码的最下面 加上一个对象数…

RocketMQ高可用架构涉及常用功能整理

RocketMQ高可用架构涉及常用功能整理 1. 集群高可用系统架构和相关组件1.1 架构说明1.2 相关概念说明1.3 消息模型1.3.1 点对点模型1.3.2 发布订阅模型1.3.3 消息过滤 2. rocketmq的核心参数3. rocketmq常用命令4. 事务性4.1 数据写入流程4.2 数据读流程4.3 事务消息 5. 疑问和…

如何查看Mosquitto的连接数量

Mosquitto 提供了一套管理 API,允许你通过 HTTP 或 WebSocket 连接来监控和管理 MQTT 代理。这个 API 需要通过配置文件启用。方法如下: 1、启用管理 API: 要启用管理 API,你需要编辑 Mosquitto 的配置文件,通常是 mo…

AOSP Android源码编译

从头搭建Android源码编译环境(Ubuntu 18.04 / 20.04 / 22.04)_ubuntu搭建android编译环境-CSDN博客Android系统编译流程详解(一)-腾讯云开发者社区-腾讯云 (tencent.com) Android系统源码的整编和单编 - schips - 博客园 (cnblogs.com) 修改初始化文件…

Linux下HTTP隧道技术的应用场景与优势分析

亲爱的Linux侠们,今天我们来聊一聊Linux下HTTP隧道技术的应用场景与优势。在这个网络时代,HTTP隧道技术就如同一位神秘的“魔法师”,为我们解决了许多棘手的网络问题。 首先,让我们来看看HTTP隧道技术在哪些场景下能大展身手。 …

GenAI的“关键一跃”:推理与知识

当前的人工智能领域正通过生成式人工智能(GenAI)经历一场重大转变。这一转变不仅代表了技术上的飞跃,更标志着人工智能领域的范式转变,引发了有关GenAI的独特特性及其深远影响的关键问题讨论。 植根于计算革命的丰富历史&#xff…

JavaWeb——002JS Vue快速入门

目录 一、JS快速入门​编辑 1、什么是JavaScript?​编辑 2、JS引入方式​编辑 2.1、示例代码 3、JS基础语法 3.1、书写语法 3.2、变量​编辑 3.3、数据类型 3.4、运算符​编辑 3.5、流程控制语句​编辑 4、JS函数 4.1、第一种函数定义方式 function funcName(参数…

【统计分析数学模型】聚类分析

【统计分析数学模型】聚类分析 一、聚类分析1. 基本原理2. 距离的度量(1)变量的测量尺度(2)距离(3)R语言计算距离 三、聚类方法1. 系统聚类法2. K均值法 三、示例1. Q型聚类(1)问题描…

大白话解析LevelDB: Block Iterator

文章目录 Block IteratorIterator 接口Block Iterator 的实现Block Iterator 的私有成员Block Iterator 的构造函数Block::Iter::Valid()Block::Iter::status()Block::Iter::key()Block::Iter::value()Block::Iter::Next()Block::Iter::Prev()Block::Iter::Seek(const Slice&am…

【2024软件测试面试必会技能】Appium自动化(4):Appium工作原理及Desired Capabilities配置

Appium工作原理 Appium工作原理图如下: 脚本请求——>4723端口appium server——>解析参数给PC端4724端口——>发送给设备4724端口——>通过设备4724端口发给bootstrap.jar——>Bootstrap.jar把命令发给uiautomator; sonWireProtocol&a…

java常用应用程序编程接口(API)——Objects类和包装类

前言: Object类和Objects类是完全不同的两个类,之前有说过Object类,这次说一下Objects类。打好基础,daydayup! Object类可以看这篇:java常用应用程序编程接口(API)——Object类概述及常用方法 O…

计算机网络基础之计算机网络组成与分类

计算机网络基础 计算机网络是计算机技术与通信技术发展相结合的产物,并在用户需求的促进下得到进一步的发展。通信技术为计算机之间的数据传输和交换提供了必需的手段,而计算机技术又渗透到了通信领域,提高了通信网络的性能。 计算机网络的…

Codeforces Round 926 (Div. 2) C. Sasha and the Casino

题目链接 思路: 他想知道自己是否可以赢取尽量多的数量的硬币。即他要采取措施让自己的硬币在任何情况下(不会连输超过x次)都要不断增多。 即我们考虑第一次,第二次,,,第x次,每一次都有赢和输的…

【谈一谈】: 我们工作中的单例模式有哪些写法?

单例模式的多种写法 我们要实现一个单例,首先最重要的是什么? 当然是把构造函数私有化,变成private类型,(为啥? 单例单例,如果谁都能通过构造函数创建对象,还叫单例吗?是不~) 嗯~我们构造函数私有化后,我们应该操作啥呢? 接着我们需要提供一个方法,这个方法要保证初始化有且…

数据脱敏(六)脱敏算法-加密算法

脱敏算法篇使用阿里云数据脱敏算法为模板,使用算子平台快速搭建流程来展示数据 "加密脱敏"是一种数据处理技术,主要用于保护个人隐私和数据安全。它通过将敏感信息(如姓名、身份证号、电话号码等)进行加密处理,使其无法…