机器学习---无偏估计

1. 如何理解无偏估计

无偏估计:就是我认为所有样本出现的概率⼀样。 假如有N种样本我们认为所有样本出现概率都是

1/N。然后根据这个来计算数学期望。此时的数学期望就是我们平常讲 的平均值。数学期望本质就

是平均值。

2. 无偏估计为何叫做“无偏”?它要“估计”什么?

首先回答第⼀个问题:它要“估计”什么?

它要估计的是整体的数学期望(平均值)。

第⼆个问题:那为何叫做无偏?有偏是什么?

假设这个是⼀些样本的集合X = x1, x2, x3, ..., xn,我们根据样本估计整体的数学期望(平均值)。

因为正常求期望是加权和,什么叫加权和?,这个就叫加权和。

每个样本出现概率不⼀样,概率大的乘起来就大,这个就产生偏重了(有偏估计)。

但是我们不知道某个样本出现的概率。比如你从别⼈口袋里面随机拿了3张钞票。两张是十块钱,

⼀张100 元,然后你想估计下他口袋里的剩下的钱平均下来每张多少钱(估计平均值)。

然后呢?无偏估计计算数学期望就是认为所有样本出现概率⼀样大,没有看不起哪个样本。

回到求钱的平均值的问题。无偏估计我们认为每张钞票出现概率都是1/2(因为只出现了10和100

这两种情况,所以是1/2。如果是出现1 10 100三种情况,每种情况概率则是1/3。

哪怕拿到了两张十块钱,我还是认为十块钱出现的概率和100元的概率⼀样。不偏心。

所以无偏估计,所估计的别⼈口袋每张钱的数学期望(平均值)= 10 ∗ 1/2 + 100 ∗ 1/2。

有偏估计那就是偏重那些出现次数多的样本。认为样本的概率是不⼀样的。 我出现了两次十块

钱,那么我认为十块钱的概率是2/3,100块钱概率只有1/3。

有偏所估计的别⼈口袋每张钱的数学期望(平均值)= 10 ∗ 2/3 + 100 ∗ 1/3。

3. 为何要用无偏估计?

因为现实生活中我不知道某个样本出现的概率,就像骰子,我不知道他是不是加过水银。 所以我

们暂时按照每种情况出现概率⼀样来算。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/652203.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

20240128-读书带来的影响

我本身不算是一个特别喜欢读书的人,更多的时候其实是为了读书而读书。在坚持每天读了一小时书之后,我发现自身开始慢慢有些变化。是什么时候突然有了这种感悟呢,是最近每周5小时左右的微信读书以及纸质书籍的阅读,让我体会到了读书…

常见の算法5

位图 一个int类型32字节,可以表示0-31这32个数出没出现过,出现过1没出现0,再扩大一点搞个数组,就可以表示0-1023出没出现过,一个long类型可储存64位 如何把10位组成的数,第四位由1改成零 package class05…

嵌入式linux面试题目总结

Linux系统中常见的面试题目,分享,欢迎大家前来交流学习。 1、嵌入式系统中的CAN通信协议是什么? CAN(Controller Area Network)通信协议是一种广泛应用于嵌入式系统中的串行通信协议。它最初由德国汽车工业联合会开发…

mysql升级5.X到mysql8关键字问题

数据库系统升级,要注意很多东西,5.x版本升级到mysql8,是一次大的版本升级,因此要注意诸多事项. charset更新 关键字 一些在5.x版本没有问题的字段,在mysql8中会触发关键字. 例如: rank,在mys…

VS如何打包环境

以VS2005为例子,做好的软件需要发给客户现场升级,有时候总是因为系统,环境变量不同导致软件不能正常运行打开,这也是程序员非常头疼的问题,今天我们就一起看下打包环境变量. 这样我们的环境变量就打包到setup中了,目标机台安装即可!!!

新概念英语第二册(43)上

【New words and expressions】生词和短语(13) pole n.(地球的)极 flight n. 飞行 explorer n. 探险家 lie …

[Python] numpy - 如何对数组进行降维或者升维

什么是数组升维? 数组升维是指将原本低维数组转换为更高维的数组的操作。在编程中,数组是一种存储多个相同类型数据的连续内存空间。升维操作可以通过添加额外的维度来增加数组的维数。 举个例子,将一个一维数组升维为二维数组可以使用resh…

Java集合-Map接口(key-value)

Map接口的特点:①KV键值对方式存储②Key键唯一,Value允许重复③无序。 Map有四个实现类:1.HashMap类2.LinkedHashMap类3.TreeMap类4.Hashtable类 1.HashMap类: 存储结构:哈希表 数组Node[ ] 链表(红黑…

在windows环境下安装hadoop

Hadoop是一个分布式系统基础架构。用户可以在不了解分布式底层细节的情况下,开发分布式程序。但这个架构是基于java语言开发的,所以要先进行jdk的安装,如果电脑已经配置过jdk或者是曾经运行成功过java文件,那就可以跳过第一步。 …

想用verilog写一个npu 需要什么学习路线?

要用Verilog编写一个NPU(神经处理单元),你需要经过以下学习路线: 数字电路基础: 学习数字电路的基本概念,包括逻辑门、寄存器、时钟信号、信号传输等。 Verilog编程语言: 学习Verilog HDL&…

Jenkins上跑自动化项目,case出现错误时,导致项目运行时间过长,该如何处理?

1、方案一:Jenkins上调整 进入配置: 构建环境: 自行选择超时时间即可~ 2、方案二:代码调整【python】 安装插件:pytest-timeout 选择一:装饰器用法:将单个测试用例标记为超时&…

【随谈】为什么高端开发岗要求研究过源码?如何研究?

今天来聊一个简单的问题:研究源码有什么用? 不知道你是否注意过,如果找薪资3万以上的岗位,往往都要求研究过框架和中间件源码的优先考虑。 我们随便选几个例子: 这里条件虽然写了很多,但是最重要的都是要…

编程笔记 html5cssjs 063 JavaScrip输出

编程笔记 html5&css&js 063 JavaScrip输出 一、JavaScript 输出方式二、弹出警告框来显示数据三、操作 HTML 元素四、写到 HTML 文档五 、写到控制台小结 JavaScript 输出。JavaScript 没有任何打印或者输出的函数。JavaScript输出主要是显示数据,以使我们看…

Hadoop集群部署流程

前置要求 需要3台虚拟机,系统为Centos7,分别host命名为node1,node2,node3,密码均为root请确保这三台虚拟机已经完成了JDK、SSH免密、关闭防火墙、配置主机名映射等前置操作 在3台虚拟机的/etc/hosts文件中&#xff0…

Java Card调试系统

近年来,嵌入式系统发展迅猛,已经广泛的渗透到了人们日常生活的方方面面中。由于市场对嵌入式系统要求越来越细致深入,致使其开发也越来越复杂。市场日益激烈的竞争趋势致使对嵌入式系统开发周期的要求不断提高,这时支撑软件高效开发的嵌入式开发工具特别是调试工具就显得至关重…

【Docker】快速入门手册

目录 1.概述 1.1.安装 1.2.阿里云镜像加速 1.3.运行原理 2.常用操作 2.1.帮助命令 2.2.镜像操作 2.3.容器操作 2.3.1创建、启动 2.3.2.退出、停止 2.3.3.进入交互式界面 2.3.4.守护式容器交互 2.3.5.查看 2.3.6.删除 2.3.7.拷贝 3.容器数据卷 3.1.概述 3.2.使…

网页转文件下载工具

为了更快捷copy博客 做了个 网页转文件下载工具 1.0.1 更新如下: javaphpjava提供页面转换文件的微服务APIphp调用接口,输出文件下载支持网页转md 1.0.2 更新如下: 样式表切换,白天or黑夜,cookie七天保质期 未…

使用 create-react-app 创建 react 应用

一、创建项目并启动 第一步:全局安装:npm install -g create-react-app 第二步:切换到想创建项目的目录,使用命令create-react-app hello-react 第三步:进入项目目录,cd hello-react 第四步:启…

Java技术栈 —— Hadoop入门(二)

Java技术栈 —— Hadoop入门(二) 一、用MapReduce对统计单词个数1.1 项目流程1.2 可能遇到的问题1.3 代码勘误1.4 总结 一、用MapReduce对统计单词个数 1.1 项目流程 (1) 上传jar包。 (2) 上传words.txt文件。 (3) 用hadoop执行jar包的代码,…

RNN预测下一句文本简单示例

根据句子前半句的内容推理出后半部分的内容,这样的任务可以使用循环的方式来实现。 RNN(Recurrent Neural Network,循环神经网络)是一种用于处理序列数据的强大神经网络模型。与传统的前馈神经网络不同,RNN能够通过其…