python加权最小二乘_【Python】统计科学之加权最小二乘法

首页

专栏

python

文章详情

0

109064.html

统计科学之加权最小二乘法

109064.html张俊红发布于 今天 10:03

今天这篇来讲讲加权最小二乘法(WLS),加权最小二乘是在普通的最小二乘回归(OLS)的基础上进行改造的,主要是用来解决异方差问题的。

OLS的常规形式如下:

da20fef54d2d089dfe21cea4faaced25.png

我们在前面讲过OLS有几个基本假定,其中一个就是ui是随机干扰项,即随机波动的,不受其他因素的影响,即在x取不同值时var(ui)都是一个固定的常数。但有的时候ui不是随机干扰项,而是与x的取值有关的,比如在研究年龄和工资收入的之间的关系时,随着年龄越大,ui的波动是会越大的,即var(ui)不是常数了,这就是出现了异方差。此时的数据不满足OLS的基本假定,所以如果直接使用OLS进行估计,会使估计出来的结果是有偏的。

如果我们在估计的时候可以把不同x的对应的ui的大小考虑进去的话,得到的结果应该就是ok的。那我们应该如何考虑进去呢?

假设不同x对应的ui的波动(方差)为σi^2,我们在OLS基本方程左右两边同时除σi,最后得到如下结果:

15ff52e66d5f39f11402f9ec65287bad.png

为了让方程看起来更加熟悉一点,我们再做一个变换:

b9cdddca893b2e63a6c226b6c7fd3482.png

变换后的方程是不是就和普通的OLS的方程形式是一样的了,此时的方程也满足基本的OLS假定,因为我们把不同x对应的σi给除掉了。就可以利用普通OLS方程的方法进行求解了。我们把这种变换后的方程称为WLS,即加权最小二乘法。

虽然整体思路上没啥问题了,但是这里还有一个关键问题就是σi怎么获取呢?

先用普通最小二乘OLS的方法去估计去进行估计,这样就可以得到每个x对应实际的残差ui,然后将ui作为σi。1/ui作为权重在原方程左右两边相乘,将得到的新的样本值再去用普通最小二乘估计即可。

以上就是关于加权最小二乘的一个简单介绍。

mysqlpython数据挖掘数据库网页爬虫

阅读 32发布于 今天 10:03

赞收藏

分享

本作品系原创,采用《署名-非商业性使用-禁止演绎 4.0 国际》许可协议

109064.html

俊红的数据分析之路

公众号:《俊红的数据分析之路》,分享数据分析相关的内容。

关注专栏

109064.html

张俊红

公众号:《俊红的数据分析之路》,分享数据分析相关的内容。

1声望

0粉丝

关注作者

0 条评论

得票时间

109064.html

提交评论

109064.html

张俊红

公众号:《俊红的数据分析之路》,分享数据分析相关的内容。

1声望

0粉丝

关注作者

宣传栏

今天这篇来讲讲加权最小二乘法(WLS),加权最小二乘是在普通的最小二乘回归(OLS)的基础上进行改造的,主要是用来解决异方差问题的。

OLS的常规形式如下:

da20fef54d2d089dfe21cea4faaced25.png

我们在前面讲过OLS有几个基本假定,其中一个就是ui是随机干扰项,即随机波动的,不受其他因素的影响,即在x取不同值时var(ui)都是一个固定的常数。但有的时候ui不是随机干扰项,而是与x的取值有关的,比如在研究年龄和工资收入的之间的关系时,随着年龄越大,ui的波动是会越大的,即var(ui)不是常数了,这就是出现了异方差。此时的数据不满足OLS的基本假定,所以如果直接使用OLS进行估计,会使估计出来的结果是有偏的。

如果我们在估计的时候可以把不同x的对应的ui的大小考虑进去的话,得到的结果应该就是ok的。那我们应该如何考虑进去呢?

假设不同x对应的ui的波动(方差)为σi^2,我们在OLS基本方程左右两边同时除σi,最后得到如下结果:

15ff52e66d5f39f11402f9ec65287bad.png

为了让方程看起来更加熟悉一点,我们再做一个变换:

b9cdddca893b2e63a6c226b6c7fd3482.png

变换后的方程是不是就和普通的OLS的方程形式是一样的了,此时的方程也满足基本的OLS假定,因为我们把不同x对应的σi给除掉了。就可以利用普通OLS方程的方法进行求解了。我们把这种变换后的方程称为WLS,即加权最小二乘法。

虽然整体思路上没啥问题了,但是这里还有一个关键问题就是σi怎么获取呢?

先用普通最小二乘OLS的方法去估计去进行估计,这样就可以得到每个x对应实际的残差ui,然后将ui作为σi。1/ui作为权重在原方程左右两边相乘,将得到的新的样本值再去用普通最小二乘估计即可。

以上就是关于加权最小二乘的一个简单介绍。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/267457.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

关于Linux下的umask

我们创建文件的默认权限是怎么来的?如何改变这个默认权限呢? umask是什么? 当我们登录系统之后创建一个文件总是有一个默认权限的,那么这个权限是怎么来的呢?这就是umask干的事情。umask设置了用户创建文件的默认权限&…

TOJ5398: 签到大富翁(简单模拟) and TOJ 5395: 大于中值的边界元素(数组的应用)...

Python代码!!! 5395 传送门:http://acm.tzc.edu.cn/acmhome/problemdetail.do?&methodshowdetail&id5395 5398传送门:http://acm.tzc.edu.cn/acmhome/problemdetail.do?&methodshowdetail&id5398 53…

删除电脑中的mysql数据库吗_【数据库】怎么彻底删除mysql服务?

彻底删除mysql服务的步骤:1、关闭mysql服务在cmd命令行输入以下命令net stop mysql或者 我的电脑右键->管理->服务,进入后手动关闭。2、删除MySQL服务在cmd中,输入sc delete mysql,删除服务。但是MYSQL服务只是显示禁用状态…

解决NGINX PHP No input file specified

解决NGINX PHP "No input file specified" 打开一个页面<?php phpinfo(); ?> 然后在游览器下运行&#xff1a;页面提示 No input file specified. FastCGI模式下访问php文件时&#xff0c;出现No input file specified.错误查看access.log 发现是 404 原因…

IE8开发人员工具资料

IE8相对以前的版本还是“改邪归正”了很多&#xff0c;居然提供一个很好用的开发人员工具&#xff0c;着实要夸一夸的&#xff0c;作为使用者我们还是要认真看看这东西怎么用&#xff0c;以便能为己用&#xff0c;网上资料很多再次整理一些。 IE8开发人员工具教程&#xff08;一…

hive mysql 外部表_Hive中的几种表(内部表、外部表...)

这里是在基于完成mysql数据库的安装后使用Hive&#xff1a;在windows中使用navicat远程登录到Linux下面的mysql数据之后&#xff0c;在mysql数据库里面有个DBS表&#xff0c;该表存放的就是hive表在hdfs系统中的路径&#xff0c;这里默认应该是hdfs://hadoop0:9000/user/hive/w…

Web Service 基本概念和技术应用

(一) Web Service 技术的名词解释 往往某一知识点的基本概念总是枯燥而乏味的,但若能花费些时间好好的理解,也能获益匪浅. Web Service 也称作 XML Web Service,是一种可以接收从 Internet 或 Intranet 上的其它系统中传递过来的请求,是轻量级的独立的通讯技术.通过 SOAP 在 We…

mysql主从配置 简书_Mysql主从配置,实现读写分离-Go语言中文社区

转载&#xff1a;https://www.cnblogs.com/alvin_xp/p/4162249.html大型网站为了软解大量的并发访问&#xff0c;除了在网站实现分布式负载均衡&#xff0c;远远不够。到了数据业务层、数据访问层&#xff0c;如果还是传统的数据结构&#xff0c;或者只是单单靠一台服务器扛&am…

TensorFlow 官方文档中文版

TensorFlow 官方文档中文版&#xff1a; http://wiki.jikexueyuan.com/project/tensorflow-zh/ w3cschool https://www.w3cschool.cn/tensorflow_python/转载于:https://www.cnblogs.com/huangsxj/p/8573140.html

continue 的用户及实例

continue 跳出本次循环&#xff0c;继续下一次循环 “break”是跳出整个循环 实例1&#xff1a; for i in range(10): if i <5: continue    #这里条件是小于5&#xff0c;满足条件的就跳出了本次循环&#xff0c;不在执行print&#xff0c;所以最终打印的是5…

VI编辑器的基本使用

VI编辑器 VIM是一个LINUX和UNIX的一个强大编辑器 #vi file 如果有file这个文件直接进入&#xff0c;如果没有则新建后进入。 Vi三种模式 Command mode 命令模式 按esc进入命令模式 Insert mode 编辑模式 按a. i. o都可以进入编辑模式 Ex mode 末行模式 按: 进入末行模式 命令模…

mysql报错注入实战_MySQL手工注入实战

实战记录&#xff0c;日本某站注入点 and 语句测试and11 返回正常&#xff0c;and2跳回首页&#xff0c;可能过滤了用 ’ 测试返回错误页面判断为注入点order by语句查询字段数测试字段数为9and 12 UNION SELECT 1,2,3,4,5,6,7,8,9报错联合查询语句&#xff0c;查询显示位2、3为…

20个简约风格网站设计作品欣赏

这篇文章收集了20个简洁清爽的网站设计作品案例&#xff0c;设计师们能够通过这些优秀的网页设计作品获得灵感&#xff0c;进而设计出更精美&#xff0c;更具有创意的网站作品&#xff0c;一起欣赏。vnsagaPure – Minimal WordPress themeAssemblydeladeeus design studioHocu…

python 股票自动交易从零开始_Python股票自动交易从零开始

课程目录1.Python股票自动交易从零开始~第一集~简介(Av24528809,P1).mp42.Python股票自动交易从零开始~第二集~安装工具包(Av24528809,P2).mp43.Python股票自动交易从零开始~第二集番外~配置Mac工作环境(Av24528809,P3).mp44.Python股票自动交易从零开始~第三集~获得股票列表-A…

[Js-开发常识]为什么定义实体类属性建议用 Ineger 而不是 int

因为 Integer 包装类型允许 null 值&#xff0c;避免在框架底层调用时产生空指针异常所以一般建议使用 Integer转载于:https://www.cnblogs.com/jiasq/p/8588767.html

python 银行工作_Python:银行系统实战(一)

最近突然抽筋想做一下大学时候做过的银行系统实战~代码就发在这里啦~学弟学妹们请查收~不过是python版本的&#xff0c;你们也用不上。。。两个py文件&#xff0c;一个是后台系统处理的&#xff0c;一个是总控py文件如下&#xff1a;view.py 内容如下&#xff1a;import timecl…

出现 java.util.ConcurrentModificationException 时的解决办法

for (int i0; i<list.size(); i) {  // 只有在这种方式遍历集合时&#xff0c;同时对集合增加、删除才不会影响。 // list.remove(list.get(i)); } 在对一个map进行迭代遍历并删除一些符合条件的键值对的时候&#xff0c;容易出现 java.util.ConcurrentModificati…

深入剖析LinkedList:揭秘底层原理

文章目录 一、 概述LinkedList1.1 LinkedList简介1.2 LinkedList的优点和缺点 二、 LinkedList数据结构分析2.1 Node节点结构体解析2.2 LinkedList实现了双向链表的原因2.3 LinkedList如何实现了链表的基本操作&#xff08;增删改查&#xff09;2.4 LinkedList的遍历方式 三、 …

【Mysql优化】索引覆盖

索引覆盖 是指 如果查询的列恰好是索引的一部分,那么查询只需要在索引文件上进行,不需要回行到磁盘再找数据.这种查询速度非常快,称为”索引覆盖”,比平时的查询少一次到磁盘读数据的操作。(索引正好覆盖到查询的数据) 例如下面: mysql> use exam9; Database changed mysql&…

mysql strtok_c函数: strtok 和 strtok_r 详解

函数名: strtok功 能: 查找由在第二个串中指定的分界符分隔开的单词用 法: char *strtok(char *str1, char *str2);程序例:#include #include int main(void){char input[16] "abc,d";char *p;/* strtok places a NULL…