python计算期望值_机器学习:计算方差时为何除以n-1

小弟准备了数据结构、Java、大数据、AI、面试题、python等各种资料 需要领取等朋友麻烦 转发此文,然后私信【学习】即可获取

设样本均值为

8111eef8a13559b9d7e3a76f03f8181c.png
7ce3fc2ebab7d520bf93bbdfaef924e7.gif

​,样本方差为

0b4cdb4b1cd395d6142cb749cab5a1dd.png
7ce3fc2ebab7d520bf93bbdfaef924e7.gif

​,总体均值为

d4230d98ab5b3e5f53a6c4f60ffe4c53.png
7ce3fc2ebab7d520bf93bbdfaef924e7.gif

​,总体方差为

0f624be398509f0a194094f321d7fd05.png
7ce3fc2ebab7d520bf93bbdfaef924e7.gif

​,那么样本方差

0b4cdb4b1cd395d6142cb749cab5a1dd.png
7ce3fc2ebab7d520bf93bbdfaef924e7.gif

​有如下公式:

3a39538c4f513b85adc1320485091264.png

7ce3fc2ebab7d520bf93bbdfaef924e7.gif

很多人可能都会有疑问,为什么要除以n-1,而不是n,但是翻阅资料,发现很多都是交代到,如果除以n,对样本方差的估计不是无偏估计,比总体方差要小,要想是无偏估计就要调小分母,所以除以n-1,那么问题来了,为什么不是除以n-2、n-3等等。所以在这里彻底总结一下,首先交代一下无偏估计。

无偏估计

以例子来说明,假如你想知道一所大学里学生的平均身高是多少,一个大学好几万人,全部统计有点不现实,但是你可以先随机挑选100个人,统计他们的身高,然后计算出他们的平均值,记为

ed7952f1714767ab529a45045806cc32.png
7ce3fc2ebab7d520bf93bbdfaef924e7.gif

​。如果你只是把

ed7952f1714767ab529a45045806cc32.png
7ce3fc2ebab7d520bf93bbdfaef924e7.gif

​作为整体的身高平均值,误差肯定很大,因为你再随机挑选出100个人,身高平均值很可能就跟刚才计算的不同,为了使得统计结果更加精确,你需要多抽取几次,然后分别计算出他们的平均值,分别记为:

b2a586517ba6e9b07e090b49194fb0b3.png
7ce3fc2ebab7d520bf93bbdfaef924e7.gif

​然后在把这些平均值,再做平均,记为:

26f64dabd3e303cd369bed1b6548e57a.png
7ce3fc2ebab7d520bf93bbdfaef924e7.gif

​,这样的结果肯定比只计算一次更加精确,随着重复抽取的次数增多,这个期望值会越来越接近总体均值

d4230d98ab5b3e5f53a6c4f60ffe4c53.png
7ce3fc2ebab7d520bf93bbdfaef924e7.gif

​,如果满足

401c2900767d14bb7852b953d4828983.png
7ce3fc2ebab7d520bf93bbdfaef924e7.gif

​,这就是一个无偏估计,其中统计的样本均值也是一个随机变量,

15c797f9ed2daaee36da16d28db640fd.png
7ce3fc2ebab7d520bf93bbdfaef924e7.gif

​就是

8111eef8a13559b9d7e3a76f03f8181c.png
7ce3fc2ebab7d520bf93bbdfaef924e7.gif

​的一个取值。无偏估计的意义是:在多次重复下,它们的平均数接近所估计的参数真值。

介绍无偏估计的意义就是,我们计算的样本方差,希望它是总体方差的一个无偏估计,那么假如我们的样本方差是如下形式:

dd869fce983fcb1db5972daea1b92353.png
7ce3fc2ebab7d520bf93bbdfaef924e7.gif

那么,我们根据无偏估计的定义可得:

c5ac5f319a11c96b6ce75147165d9b52.png

7ce3fc2ebab7d520bf93bbdfaef924e7.gif
78d521de1ef14f0738961bc6b4c5cc87.png

7ce3fc2ebab7d520bf93bbdfaef924e7.gif

由上式可以看出如果除以n,那么样本方差比总体方差的值偏小,那么该怎么修正,使得样本方差式总体方差的无偏估计呢?我们接着上式继续化简:讲解,证明

e7198bb75591922056e9e4abdf0e375f.png
7ce3fc2ebab7d520bf93bbdfaef924e7.gif

到这里得到如下式子,看到了什么?该怎修正似乎有点眉目。

53733e031bc25beccfa9d438c9968a2c.png
7ce3fc2ebab7d520bf93bbdfaef924e7.gif

如果让我们假设的样本方差

0b4cdb4b1cd395d6142cb749cab5a1dd.png
7ce3fc2ebab7d520bf93bbdfaef924e7.gif

​乘以

d026e8f1764241ea8f5c58b57d30fd6f.png
7ce3fc2ebab7d520bf93bbdfaef924e7.gif

​,即修正成如下形式,是不是可以得到样本方差是总体方差

0f624be398509f0a194094f321d7fd05.png
7ce3fc2ebab7d520bf93bbdfaef924e7.gif

​的无偏估计呢?

6dc761ccfb6e6bc461b4687ce5684d05.png
7ce3fc2ebab7d520bf93bbdfaef924e7.gif

则:

93f982265e3e750082f1484af769057a.png

7ce3fc2ebab7d520bf93bbdfaef924e7.gif
c7717c56aaf9011c20786752d8e7b6fa.png

7ce3fc2ebab7d520bf93bbdfaef924e7.gif

因此修正之后的样本方差的期望是总体方差

0f624be398509f0a194094f321d7fd05.png
7ce3fc2ebab7d520bf93bbdfaef924e7.gif

​的一个无偏估计,这就是为什么分母为何要除以n-1。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/505075.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

linux rpm版本号,linux中RPM包命名规则

RPM包的一般格式为:name-version-arch.rpmname-version-arch.src.rpm例:httpd-2.2.3-29.el5.i386.rpmhttpd-devel-2.2.3-29.el5.i386.rpmhttpd-manual-2.2.3-29.el5.i386.rpmsystem-config-httpd-1.3.3.3-1.el5.noarch.rpm(1)name,如&#xf…

python十点半游戏代码_Python实现Pig Latin小游戏实例代码

前言: 本文研究的主要是Python实现pig Latin小游戏的简单代码,具体介绍如下。 Pig Latin是一个语言游戏。 步骤: 1.让用户输入一个英文单词 2.确保用户输入一个有效单词 3.将单词转换成Pig Latin 4.显示转换结果 一、Input 函数:r…

查看linux系统的sp,查看linux系统版本命令

一。查看内核版本命令:1) [[email protected]_SYS ~]# cat /proc/versionLinux version 2.6.18-238.el5 ([email protected]) (gcc version 4.1.2 20080704 (Red Hat 4.1.2-50)) #1 SMP Sun Dec 19 14:22:44 EST 20102)[[email protected]_SYS ~]# uname -r2.6.18-2…

程序的图标无法改变_安卓微信7.0.7内测版发布,细节更新,小程序功能优化

昨天,微信 7.0.7 for Android 内测版悄然发布,如何参加内测可以咨询本人。按照近来的惯例,安卓的内测版的功能会在随后的更新iOS正式版中体现,并且要先于安卓正式版发布。下面我们就来简单介绍一下本次更新的具体内容。一、「…」…

vue获取input的属性_vuejs 中如何优雅的获取 Input 值

原生 js使用 getElementById 比较麻烦的地方需要为元素设置 id设置 id 之后,无法复用,因为一个页面中不能存在两个相同的 id双向绑定 v-model分两种情况input 默认为空。这种情况使用 v-model 最方便,通过 this.inputName 即可获取到对应的值…

linux设置系统自动开机,Linux系统中设置开机自动运行的两种方法

有时可能会需要在重启时或者每次系统启动时运行某些命令或者脚本。我们要怎样做呢?本文中我们就对此进行讨论。 我们会用两种方法来描述如何在 CentOS/RHEL 以及 Ubuntu 系统上做到重启或者系统启动时执行命令和脚本。 两种方法都通过了测试。方法 1 – 使用 rc.loc…

论文页眉奇偶页不同怎么设置_怎样设置Word页眉页脚奇偶页不同?

来自Excel之家,侵联系删有伙伴问,怎么设置满足下列要求的页眉页脚:页眉要求正文部分偶数页居中对齐为“XXXX毕业设计(论文)”,奇数页居中对齐是各章章名;字体采用宋体5号。页眉之下有一条下划线。封面和目录页没有页眉…

layui添加复选框_layui复选框使用介绍

layui复选框:效果图layui复选框,一个主的复选框控制多个从复选框,主复选框和从复选框的颜色不一样layui复选框的样式,都是在选然后才会有的,所以直接通过css设置就实现不了了。只可以通过js动态设置html代码使用了jfin…

如何检测python是否安装_使用Python检查系统中是否安装了一个软件包?

How can I check is some package is installed in my system. My system is Linux, but even better if it could works in other OSs. I mean OS specific package (like could be *.rpm or *.deb). Is there any python module or script that could do it? 解决方案 To fi…

git进入项目目录 windows_Git使用教程 Windows使用Git全攻略

在Windows上安装Git点击Download开始下载,下载完成后双击安装包进行安装,之后一直点击“下一步”就可以完成安装了。创建代码仓库首先配置一下身份,这样在提交代码的时候Git就可以知道是谁提交的了。打开Git Bash,输入下面的命令g…

linux调度程序是根据进程的动态优先级还是静态优先级来调度进程的,LINUX内核面试题...

该链接有每个题详细的答案讲解http://www.docin.com/p-442803876.html 以下答案可能不是很详细。 1) Linux中主要有哪几种内核锁? Linux的同步机制从2.0到2.6以来不断发展完善。从最初的原子操作,到后来的信号量,从大内核锁到今天的自旋锁。这…

android 自定义控件的宽高_巧用Handler获取View控件信息

众所周知,在Android实际开发中,对于某些复杂多变的情况,控件的位置摆放、大小控制并非是xml类型的layout文件完全可以搞定的。此时,我们通常会使用Java代码来通过动态计算,将指定的控件摆放在相应的位置,并…

ascii码01100001_ASCII码跟数字

小小乌龟把头藏: - - 我竟无言以对!举个例子嘛,本质是这样,你还是把C语言基础什么的看几遍吧。给你摘录一点书上的,估计你更能看懂:计算机是以二进制的形式来存储数据的,它只认识0和1两个数字,我…

深度linux缺点,原来国产深度系统有这些“缺陷”,难怪只有少数人在使用!

相信大家或多或少都听说过USO统一操作系统,一款可以支持多款国产芯片的国产操作系统。该系统从公布直至到现在,它一直保持着非常高的关注度。但是,有些用户认为该系统只不是Deepin换了壳而已。从系统界面来看,UOS和Deepin的确非常…

如何ping端口_干货 | 如何正确处理常见的8大网络故障

网络故障是最容易出现的,也是比较难解决的问题,尤其是经常跟电脑及交换机打交道的朋友。今天就和大家来说说日常工作中,常见的网络故障详细分析及解决方法。交换机刚加电时网络无法通信【故障现象】交换机刚刚开启的时候无法连接至其他网络&a…

前端vue显示柱状图_Vue—Echarts 柱状图

使用Vue做后台管理系统的时候避免不了使用Echarts来展示对应的数据,下面是使用Echarts柱状图来展示对应数据的实例。ee05abaf9633184a9c012631b642d970.png使用npm安装Echartsnpm install echarts --save在man.js中引入对应的echartsimport ECharts from vue-echart…

c语言程序设计第2章,C语言程序设计第2章 结构化程序设计与算法.ppt

C语言程序设计第2章 结构化程序设计与算法.ppt现在人们公认的具有“良好风格”的程序设计方法之一是所谓的“结构化程序设计方法”。其核心是规定了算法的三种基本结构顺序结构、选择结构和循环结构。按照结构化程序设计的观点,任何算法功能都可以通过三种基本程序结…

python读取word指定内容_python读取word 中指定位置的表格及表格数据

1.Word文档如下:2.代码 # -*- coding: UTF-8 -*- from docx import Document def readSpecTable(filename, specText): document Document(filename) paragraphs document.paragraphs allTables document.tables specText specText.encode(utf-8).decode(utf-8)…

xml建模包括以下_为什么要进行建模仿真?

没有“模型”作为基础的话,很多当今的前沿概念将无法真正落地!今天,数字孪生、人工智能、工业互联网、边缘计算这些概念在整个产业里非常的火热,但是,要知道,如果这些概念没有“模型”作为基础的话&#xf…

中兴没有云服务器_中国移动携手中兴通讯推进5G网络云建设

11月23日消息今年8月,中国移动通信集团公司党组成员、副总裁李慧镝在“中国信息化百人会2020年峰会”上表示,中国移动正大力推进网络云化部署,实现云网融合,NFV网络云服务器规模达6万台。2020北京国际信息通信展期间,中…