python计算期望值_机器学习:计算方差时为何除以n-1

小弟准备了数据结构、Java、大数据、AI、面试题、python等各种资料 需要领取等朋友麻烦 转发此文,然后私信【学习】即可获取

设样本均值为

8111eef8a13559b9d7e3a76f03f8181c.png
7ce3fc2ebab7d520bf93bbdfaef924e7.gif

​,样本方差为

0b4cdb4b1cd395d6142cb749cab5a1dd.png
7ce3fc2ebab7d520bf93bbdfaef924e7.gif

​,总体均值为

d4230d98ab5b3e5f53a6c4f60ffe4c53.png
7ce3fc2ebab7d520bf93bbdfaef924e7.gif

​,总体方差为

0f624be398509f0a194094f321d7fd05.png
7ce3fc2ebab7d520bf93bbdfaef924e7.gif

​,那么样本方差

0b4cdb4b1cd395d6142cb749cab5a1dd.png
7ce3fc2ebab7d520bf93bbdfaef924e7.gif

​有如下公式:

3a39538c4f513b85adc1320485091264.png

7ce3fc2ebab7d520bf93bbdfaef924e7.gif

很多人可能都会有疑问,为什么要除以n-1,而不是n,但是翻阅资料,发现很多都是交代到,如果除以n,对样本方差的估计不是无偏估计,比总体方差要小,要想是无偏估计就要调小分母,所以除以n-1,那么问题来了,为什么不是除以n-2、n-3等等。所以在这里彻底总结一下,首先交代一下无偏估计。

无偏估计

以例子来说明,假如你想知道一所大学里学生的平均身高是多少,一个大学好几万人,全部统计有点不现实,但是你可以先随机挑选100个人,统计他们的身高,然后计算出他们的平均值,记为

ed7952f1714767ab529a45045806cc32.png
7ce3fc2ebab7d520bf93bbdfaef924e7.gif

​。如果你只是把

ed7952f1714767ab529a45045806cc32.png
7ce3fc2ebab7d520bf93bbdfaef924e7.gif

​作为整体的身高平均值,误差肯定很大,因为你再随机挑选出100个人,身高平均值很可能就跟刚才计算的不同,为了使得统计结果更加精确,你需要多抽取几次,然后分别计算出他们的平均值,分别记为:

b2a586517ba6e9b07e090b49194fb0b3.png
7ce3fc2ebab7d520bf93bbdfaef924e7.gif

​然后在把这些平均值,再做平均,记为:

26f64dabd3e303cd369bed1b6548e57a.png
7ce3fc2ebab7d520bf93bbdfaef924e7.gif

​,这样的结果肯定比只计算一次更加精确,随着重复抽取的次数增多,这个期望值会越来越接近总体均值

d4230d98ab5b3e5f53a6c4f60ffe4c53.png
7ce3fc2ebab7d520bf93bbdfaef924e7.gif

​,如果满足

401c2900767d14bb7852b953d4828983.png
7ce3fc2ebab7d520bf93bbdfaef924e7.gif

​,这就是一个无偏估计,其中统计的样本均值也是一个随机变量,

15c797f9ed2daaee36da16d28db640fd.png
7ce3fc2ebab7d520bf93bbdfaef924e7.gif

​就是

8111eef8a13559b9d7e3a76f03f8181c.png
7ce3fc2ebab7d520bf93bbdfaef924e7.gif

​的一个取值。无偏估计的意义是:在多次重复下,它们的平均数接近所估计的参数真值。

介绍无偏估计的意义就是,我们计算的样本方差,希望它是总体方差的一个无偏估计,那么假如我们的样本方差是如下形式:

dd869fce983fcb1db5972daea1b92353.png
7ce3fc2ebab7d520bf93bbdfaef924e7.gif

那么,我们根据无偏估计的定义可得:

c5ac5f319a11c96b6ce75147165d9b52.png

7ce3fc2ebab7d520bf93bbdfaef924e7.gif
78d521de1ef14f0738961bc6b4c5cc87.png

7ce3fc2ebab7d520bf93bbdfaef924e7.gif

由上式可以看出如果除以n,那么样本方差比总体方差的值偏小,那么该怎么修正,使得样本方差式总体方差的无偏估计呢?我们接着上式继续化简:讲解,证明

e7198bb75591922056e9e4abdf0e375f.png
7ce3fc2ebab7d520bf93bbdfaef924e7.gif

到这里得到如下式子,看到了什么?该怎修正似乎有点眉目。

53733e031bc25beccfa9d438c9968a2c.png
7ce3fc2ebab7d520bf93bbdfaef924e7.gif

如果让我们假设的样本方差

0b4cdb4b1cd395d6142cb749cab5a1dd.png
7ce3fc2ebab7d520bf93bbdfaef924e7.gif

​乘以

d026e8f1764241ea8f5c58b57d30fd6f.png
7ce3fc2ebab7d520bf93bbdfaef924e7.gif

​,即修正成如下形式,是不是可以得到样本方差是总体方差

0f624be398509f0a194094f321d7fd05.png
7ce3fc2ebab7d520bf93bbdfaef924e7.gif

​的无偏估计呢?

6dc761ccfb6e6bc461b4687ce5684d05.png
7ce3fc2ebab7d520bf93bbdfaef924e7.gif

则:

93f982265e3e750082f1484af769057a.png

7ce3fc2ebab7d520bf93bbdfaef924e7.gif
c7717c56aaf9011c20786752d8e7b6fa.png

7ce3fc2ebab7d520bf93bbdfaef924e7.gif

因此修正之后的样本方差的期望是总体方差

0f624be398509f0a194094f321d7fd05.png
7ce3fc2ebab7d520bf93bbdfaef924e7.gif

​的一个无偏估计,这就是为什么分母为何要除以n-1。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/505075.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

程序的图标无法改变_安卓微信7.0.7内测版发布,细节更新,小程序功能优化

昨天,微信 7.0.7 for Android 内测版悄然发布,如何参加内测可以咨询本人。按照近来的惯例,安卓的内测版的功能会在随后的更新iOS正式版中体现,并且要先于安卓正式版发布。下面我们就来简单介绍一下本次更新的具体内容。一、「…」…

linux设置系统自动开机,Linux系统中设置开机自动运行的两种方法

有时可能会需要在重启时或者每次系统启动时运行某些命令或者脚本。我们要怎样做呢?本文中我们就对此进行讨论。 我们会用两种方法来描述如何在 CentOS/RHEL 以及 Ubuntu 系统上做到重启或者系统启动时执行命令和脚本。 两种方法都通过了测试。方法 1 – 使用 rc.loc…

论文页眉奇偶页不同怎么设置_怎样设置Word页眉页脚奇偶页不同?

来自Excel之家,侵联系删有伙伴问,怎么设置满足下列要求的页眉页脚:页眉要求正文部分偶数页居中对齐为“XXXX毕业设计(论文)”,奇数页居中对齐是各章章名;字体采用宋体5号。页眉之下有一条下划线。封面和目录页没有页眉…

如何检测python是否安装_使用Python检查系统中是否安装了一个软件包?

How can I check is some package is installed in my system. My system is Linux, but even better if it could works in other OSs. I mean OS specific package (like could be *.rpm or *.deb). Is there any python module or script that could do it? 解决方案 To fi…

android 自定义控件的宽高_巧用Handler获取View控件信息

众所周知,在Android实际开发中,对于某些复杂多变的情况,控件的位置摆放、大小控制并非是xml类型的layout文件完全可以搞定的。此时,我们通常会使用Java代码来通过动态计算,将指定的控件摆放在相应的位置,并…

如何ping端口_干货 | 如何正确处理常见的8大网络故障

网络故障是最容易出现的,也是比较难解决的问题,尤其是经常跟电脑及交换机打交道的朋友。今天就和大家来说说日常工作中,常见的网络故障详细分析及解决方法。交换机刚加电时网络无法通信【故障现象】交换机刚刚开启的时候无法连接至其他网络&a…

c语言程序设计第2章,C语言程序设计第2章 结构化程序设计与算法.ppt

C语言程序设计第2章 结构化程序设计与算法.ppt现在人们公认的具有“良好风格”的程序设计方法之一是所谓的“结构化程序设计方法”。其核心是规定了算法的三种基本结构顺序结构、选择结构和循环结构。按照结构化程序设计的观点,任何算法功能都可以通过三种基本程序结…

python读取word指定内容_python读取word 中指定位置的表格及表格数据

1.Word文档如下:2.代码 # -*- coding: UTF-8 -*- from docx import Document def readSpecTable(filename, specText): document Document(filename) paragraphs document.paragraphs allTables document.tables specText specText.encode(utf-8).decode(utf-8)…

xml建模包括以下_为什么要进行建模仿真?

没有“模型”作为基础的话,很多当今的前沿概念将无法真正落地!今天,数字孪生、人工智能、工业互联网、边缘计算这些概念在整个产业里非常的火热,但是,要知道,如果这些概念没有“模型”作为基础的话&#xf…

中兴没有云服务器_中国移动携手中兴通讯推进5G网络云建设

11月23日消息今年8月,中国移动通信集团公司党组成员、副总裁李慧镝在“中国信息化百人会2020年峰会”上表示,中国移动正大力推进网络云化部署,实现云网融合,NFV网络云服务器规模达6万台。2020北京国际信息通信展期间,中…

差异基因 p log2foldchange_拟南芥的基因ID批量转换?差异基因,GO/KEGG数据库注释(转录组直接送你全套流程)...

新手遇到的问题都是类似的,比如批量ID转换虽然我写过大量的教程:ID转换大全 不过都需要R基础,因为是大批量转换啊!但热心肠的植物生物信息学教学大佬还是友善的给出了解决方案我也狗尾续貂制作了一个网页工具教程:简…

mongoose 批量修改字段_WordPress图片路径批量替换方法

不少数站长在使用WordPress博客或者搬家时,需要把WordPress文章中的图片路径进行替换来解决图片不显示的问题。总结一下WP图片路径批量替换的过程,方便有此类需求的站长们学习。什么情况下批量替换图片路径1、更换了网站域名有许多网站建设初期都随便选择…

python vector_50行Python代码实现经典游戏,不仅是划水神器,更是学习利器!

Free Python Games非常适合学生,它不仅具有高度的组织性和灵活性,而且能够激发人们探索和理解能力。--Terri FurtonFree Python Games在轻松的环境中把游戏和学习结合在一起,从而减轻了编程过程中的压力。--Brett Bymaster...贪吃蛇、迷宫、吃…

laravel框架中文手册_node.js 后端框架star 排名 2020年11月更新,fastify 超 egg

发布时间以首个版本发布(0.x)为准。第一名: express 50.8k (2010年1月发布) 目前star 和下载量最高的老牌框架。https://github.com/expressjs/express​github.com第二名:meteor 42.1k (2012年…

python音乐下载器交互界面_基于Python实现下载网易音乐代码实例

代码如下 # 爬取网易音乐 import requests from bs4 import BeautifulSoup import urllib.request headers {"origin": "https://music.163.com", "referer": "https://music.163.com/", "user-agent": "Mozilla/5.0 …

java 格式化字符串_Java入门 - 语言基础 - 14.String类

1.概述字符串广泛应用 在 Java 编程中,在 Java 中字符串属于对象,Java 提供了 String 类来创建和操作字符串。2.创建字符串创建字符串最简单的方式如下:String greeting "光束云";在代码中遇到字符串常量时,这里的值是 "光束…

decimal是什么类型_SQLMysql数据类型

一 前言每个数据库的数据类型从来都不是一个简单的数据结构,特别是使用不同的数据库,不同的引擎,其支持的数据类型也不一样,选择那种数据类型作为字段类型对数据库的性能也是天差地别,故对数据类型有个全面的认知&…

mybatis依赖_Spring Boot2 系列教程(二十一)整合 MyBatis

前面两篇文章和读者聊了 Spring Boot 中最简单的数据持久化方案 JdbcTemplate,JdbcTemplate 虽然简单,但是用的并不多,因为它没有 MyBatis 方便,在 SpringSpringMVC 中整合 MyBatis 步骤还是有点复杂的,要配置多个 Bea…

android获取图片格式,Android得到图片的真实格式——从本地文件或者网络文件流...

ImageFormatFeatures支持从InputStream或者File解析四种格式:jpg 、 png 、 webp 、 gif从文件本身解析格式,而不是从扩展名获取FormatHelper.getFormat(InputStream inputStream)FormatHelper.getFormat(File file)UsageStep 1Step 2解析格式String For…

pagehelper的使用_SpringBoot项目中,如何更规范的使用PageHelper分页?

SpringBoot项目中&#xff0c;如何更规范的使用PageHelper分页&#xff0c;拉勾IT课小编为大家分解一. 开发准备1. 开发工具• IntelliJ IDEA 2020.2.32. 开发环境• Red Hat Open JDK 8u256• Apache Maven 3.6.33. 开发依赖SpringBoot<dependency><groupId>org.s…