概率论和数理统计(三)数理统计基本概念

前言

“概率论”是给定一个随机变量X的分布F(x),然后求某事件A概率 P ( x ∈ A ) P(x \in A) P(xA)或者随机变量X的数字特征.“统计”是已知一组样本数据 { x 1 , x 2 , . . . x n } \{x_1,x_2,...x_n\} {x1,x2,...xn},去求分布F(x)

统计的基本概念

在统计中,总体X的分布要么未知,要么分布形式已知但参数未知,需要抽取部分个体来推断。

总体与样本

在这里插入图片描述

代表性的进一步解释: X i X_i Xi与总体 X X X 同分布。保证总体中每个值都有同样的机会被抽到

关于样本是谁随机变量,还是值?

  • 当代入总体分布函数时是值
  • 当样本分布函数(抽样分布)分析的时候是随机变量

简单随机样本的性质

在这里插入图片描述
在这里插入图片描述

统计量

统计量来自总体一个样本,不含任何未知参数,完全由样本来确定,也就是说,根据样本可以求出我们需要的任何一个统计量的值。
在这里插入图片描述

常用统计量

在这里插入图片描述

为什么样本方差的分母是 n-1?
只要采样数小于个体数,采样本身就会引入分布的误差,因此需要进行较正。
采样带来的误差就是原来分布的强化,是可以计算的n/(n-1)的修正并非随便给的
在这里插入图片描述
如图 E [ S 2 ] ∗ n / ( n − 1 ) E[S^2]*n/(n-1) E[S2]n/(n1)是正常的方差,所以修正过的样本方差 = 末修正过的样本方差*n/(n-1),

抽样分布

样本统计量的分布称为抽样分布.他通常也是随机变量X的分布函数.抽样分布中,最常用的分布其实是4种:z 分布(即正态分布)、卡方分布、t分布、F分布。

卡方分布

在这里插入图片描述

在这里插入图片描述

  • 关于标准正态N(0,1):EX=0,DX=1
  • 根据总体标准正态,求得样本卡方分布: EX=n,DX=2n
  • ∑ i = 1 n E ( X i 2 ) = ∑ i = 1 n E ( ( X i − X ˉ + X ˉ ) 2 ) \sum_{i=1}^nE(X_i^2) = \sum_{i=1}^nE((X_i-\bar{X}+\bar{X})^2) i=1nE(Xi2)=i=1nE((XiXˉ+Xˉ)2)
  • = ∑ i = 1 n E ( ( X i − X ˉ ) 2 + 2 X i X ˉ − X ˉ 2 ) ) = \sum_{i=1}^nE((X_i-\bar{X})^2+2X_i\bar{X}-\bar{X}^2)) =i=1nE((XiXˉ)2+2XiXˉXˉ2))
  • = ∑ i = 1 n [ D ( X i ) + E 2 ( X i ) ] = \sum_{i=1}^n[D(X_i)+E^2(X_i)] =i=1n[D(Xi)+E2(Xi)]

参数估计

主要解决总体分布形式已知但参数未知,即总体 X X X分布函数 F ( x , θ ) F(x, \theta) F(x,θ) 形式已知,估计未知参数 θ \theta θ

点估计

在这里插入图片描述

矩估计法

在这里插入图片描述
在这里插入图片描述

极大似然估计

在这里插入图片描述

极大似然估计以“我抽样出来的情况就是最大概率”的情况为前提,求参数 θ \theta θ的最大值.

在这里插入图片描述

估计量的优良性评判

既然是估计量,那与真实值之间就存在误差,因此需要判断估计量是否满足我们的要求,可以通过下面的几个准则来进行评判。
在这里插入图片描述
在这里插入图片描述

区间估计

在这里插入图片描述

矩估计法的前提是基于“抽样分布”和“主分布”是一致的情况下. 区间估计法则是表示定置水平一致的情况下,你去构建枢轴变量(带未知数统计量)和抽样分布,最终确定未知量

定置水平的理解: 你要估计全班的身高, 抽样了10得出了身高区间(a,b),然后给出了全部97%的人,身高在(a,b).97%就属于定置水平

在这里插入图片描述

x ˉ − u σ / n {{\bar{x}-u} \over {\sigma}/\sqrt{n}} σ/n xˉu是正态分布 N ( u , σ 2 ) N(u,\sigma^2) N(u,σ2)转为标准正态 N ( 0 , 1 ) N(0,1) N(0,1)的随机变量X的转换关系

统计量参考

在这里插入图片描述

假设检验

假设检验的基本原理:给定一个假设 H 0 H_0 H0,为了检验 H 0 H_0 H0是否正确,首先假定 H 0 H_0 H0是正确的,然后根据抽取到的样本来判断是接收还是拒绝该假设。如果样本中出现了不合理的观测值,应该拒绝 H 0 H_0 H0,否则应该接受假设

  1. 观测值:即样本的统计量
  2. “不合理”指的是小概率事件发生,常用 α \alpha α来表示这个小概率,也被称为检验的显著性水平 (与点估计中区间估计中的信置水平,差不多的功能).

定义

拒绝域与临界值

在这里插入图片描述

从某种意义上说,设计一个检验,本质上就是找到一个恰当的拒绝域W,使得当 H 0 H_0 H0成立时
P ( x ∈ W ∣ H 0 成立 ) = α P(x \in W|H_0成立)=\alpha P(xWH0成立)=α
即把“小概率事件”视为与拒绝域 W W W是等价的

假设检验存在两类错误

在这里插入图片描述

  • 通常只规定 α \alpha α的取值,即控制犯第I类错误的概率
  • 使犯第二类错误的概率尽可能小,要使两者犯错的概率都小,就必须增大样本容量

参数假设检验

在这里插入图片描述

在这里插入图片描述

统计量参考

在这里插入图片描述

关于为什么总分布都是以正态分布?

因为中心极限定理。自然界的很多现象都是由无数微小因素的叠加而产生的,而无论这种因素服从何种分布,在大尺度上来观察,其结果都应大致符合正态分布。
网上有一篇文章叫《正态分布的前世今生》,非常推荐学习概率统计的人读一读。

卡方拟合优度检验

前面的假设检验,都是通过抽样来对总体参数进行的假设检验,且集中在正态总体下的参数假设检验。但在实际问题中,可能存在我们对要研究的总体,并不知晓是什么分布。卡方拟合优度检验就是对未知总体的分布提出一个假设,例如:假设该总体服从正态分布、泊松分布、指数分布、二项分布等,根据样本获得的信息,检验假设是否成立。

拟合优度是指:抽样获得的观测频次与原假设分布中理论频次(也叫期望频次)的差异,若观测频次和理论频次越接近,意味着符合程度越好,即拟合优度更好。

在这里插入图片描述
分布拟合优度检验所采用的检验统计量渐近 χ 2 \chi^2 χ2分布

  • 使用了大样本的性质,所以要求样本容量n足够大
  • 各区间的理论频数 n p i np_i npi不能太小
简单的例子

在这里插入图片描述
在这里插入图片描述

主要参考

《为什么样本方差(sample variance)的分母是 n-1》
《数理统计学习笔记01:数理统计的基本概念》
《数理统计学习笔记03:参数的点估计》
《第六章 数理统计的基本概念》
《第七章 参数估计》
《期末复习——概率论与数理统计基本概念总结》
《第八章 假设检验》
《数理统计8.5-卡方拟合优度检验》

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/145302.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Vue3-admin-template 框架实现表单身份证获取到 出生年月、性别

一. 首先需效验输入身份证信息是否正确&#xff1a; const sfzhChange () > {// 效验身份证号格式const reg /^[1-9]\d{5}(19|20)\d{2}((0[1-9])|(1[0-2]))(([0-2][1-9])|10|20|30|31)\d{3}[0-9Xx]$/; }; 二.绑定输入框 input 事件&#xff1a; <el-form-item label&q…

监控直流防雷浪涌保护器综合方案

监控系统是一种广泛应用于安防、交通、工业、军事等领域的信息系统&#xff0c;它通过摄像机、传输线路、监控中心等设备&#xff0c;实现对目标区域的实时监视和控制。然而&#xff0c;监控系统也面临着雷电的威胁&#xff0c;雷电可能通过直击雷、感应雷、雷电波侵入等途径&a…

Linux服务器安装Dotnet8

1. 下载dotnet8 sdk 下载 .NET 8.0 SDK (v8.0.100) - Linux x64 Binaries 拿到 dotnet-sdk-8.0.100-linux-x64.tar.gz 文件 2. 把文件上传到 /usr/local/software 目录 mkdir -p /usr/local/software/dotnet8 把文件拷贝过去 mv dotnet-sdk-8.0.100-linux-x64.tar.gz /usr/loc…

安装SSL证书有什么意义?

在当今的数字化时代&#xff0c;网络安全已经成为了一个重要的议题。为了保护网站和用户数据的安全&#xff0c;许多网站都选择了安装SSL证书。同时&#xff0c;很多用户不明白安装SSL证书到底有什么意义&#xff1f; 一、网站实现加密传输 用户通过http协议访问网站时&#x…

vue使用navigator.mediaDevices.getUserMedia调用相机功能

目录 前言&#xff1a; API&#xff1a; API简单示例&#xff1a; 拍照功能 实现效果&#xff1a; 前言&#xff1a; 本文将介绍Vue中如何使用navigator.mediaDevices.getUserMedia调用相机功能&#xff0c;实现拍照使用实例&#xff0c;需要的朋友可以参考一下。 注意…

深度学习YOLOv5车辆颜色识别检测 - python opencv 计算机竞赛

文章目录 1 前言2 实现效果3 CNN卷积神经网络4 Yolov56 数据集处理及模型训练5 最后 1 前言 &#x1f525; 优质竞赛项目系列&#xff0c;今天要分享的是 &#x1f6a9; **基于深度学习YOLOv5车辆颜色识别检测 ** 该项目较为新颖&#xff0c;适合作为竞赛课题方向&#xff0…

linux高级篇基础理论一(详细文档、Apache,网站,MySQL、MySQL备份工具)

♥️作者&#xff1a;小刘在C站 ♥️个人主页&#xff1a; 小刘主页 ♥️不能因为人生的道路坎坷,就使自己的身躯变得弯曲;不能因为生活的历程漫长,就使求索的 脚步迟缓。 ♥️学习两年总结出的运维经验&#xff0c;以及思科模拟器全套网络实验教程。专栏&#xff1a;云计算技…

VS2022升级之后,原有项目出现异常

最近对VS2022做了升级&#xff0c;发现之前开发的WebApi&#xff08;使用Net5&#xff09;调试运行报错&#xff1a; 根据提示的错误信息也在网上查找了一些资料&#xff0c;均无法正常解决&#xff0c;偶然发现问题是因为VS2022升级之后&#xff0c;不再支持Net5&#xff0c;…

【开源】基于Vue和SpringBoot的固始鹅块销售系统

项目编号&#xff1a; S 060 &#xff0c;文末获取源码。 \color{red}{项目编号&#xff1a;S060&#xff0c;文末获取源码。} 项目编号&#xff1a;S060&#xff0c;文末获取源码。 目录 一、摘要1.1 项目介绍1.2 项目录屏 二、功能模块2.1 数据中心模块2.2 鹅块类型模块2.3 固…

论文技巧2

目录 1 找基准模型2 找模块小论文的三个实验怎么做对比试验Sota的挑选对⽐论⽂结果的获取3 消融实验什么是消融实验怎么做消融实验4 实例分析怎么做实例分析小论文必备三张图1 找基准模型 2 找模块 小论文的三个实验 怎么做对比试验

高性能音乐流媒体服务Diosic

什么是 Diosic ? Diosic 是一个开源的基于网络的音乐收集服务器和流媒体。主要适合需要部署在硬件规格不高的服务器上的用户。Diosic 是使用 Rust 开发的&#xff0c;具有低内存使用率和高性能以及用于流媒体音乐的非常干净的界面。 安装 在群晖上以 Docker 方式安装。 在注…

基于JavaWeb+SpringBoot+Vue医疗器械商城微信小程序系统的设计和实现

基于JavaWebSpringBootVue医疗器械商城微信小程序系统的设计和实现 源码获取入口前言主要技术系统设计功能截图Lun文目录订阅经典源码专栏Java项目精品实战案例《500套》 源码获取 源码获取入口 前言 摘 要 目前医疗器械行业作为医药行业的一个分支&#xff0c;发展十分迅速。…

Sql Prompt 10下载安装图文教程

在操作过程中&#xff0c;请暂时关闭你的防病毒软件&#xff0c;以免其误报导致操作失败。 资源 SQL Prompt 10 https://www.aliyundrive.com/s/QuMWkvE1Sv6 点击链接保存&#xff0c;或者复制本段内容&#xff0c;打开「阿里云盘」APP &#xff0c;无需下载极速在线查看&…

【数据结构】树与二叉树(十六):二叉树的基础操作:插入结点(算法Insert)

文章目录 5.2.1 二叉树二叉树性质引理5.1&#xff1a;二叉树中层数为i的结点至多有 2 i 2^i 2i个&#xff0c;其中 i ≥ 0 i \geq 0 i≥0。引理5.2&#xff1a;高度为k的二叉树中至多有 2 k 1 − 1 2^{k1}-1 2k1−1个结点&#xff0c;其中 k ≥ 0 k \geq 0 k≥0。引理5.3&…

通讯录实现之进阶版将通讯录数据保存在文件中(完整代码)

我们在之前的博客中已经写过两版通讯录了&#xff1a; 第一版是用C语言实现了通讯录&#xff0c;但是通讯录的存储人数信息是固定的&#xff0c;用完就没有了 感兴趣的可以转到对应博客看一下&#xff0c;附带链接&#xff1a;第一版通讯录 第二版是在第一版的基础上动态开辟…

三大开源向量数据库大比拼

向量数据库具有一系列广泛的好处&#xff0c;特别是在生成式人工智能方面&#xff0c;更具体地说&#xff0c;是在大语言模型&#xff08;LLM&#xff09;方面。这些好处包括先进的索引和精确的相似度搜索&#xff0c;有助于交付强大的先进项目。 本文将对三种开源向量数据库&…

“开源 vs. 闭源:大模型的未来发展趋势预测“——探讨大模型未来的发展方向

文章目录 每日一句正能量前言什么是大模型的开源与闭源开源与闭源的定义和特点开源的意义开源和闭源的优劣势比较不同的大模型企业&#xff0c;开源、闭源的策略不尽相同。企业在开发垂类模型时选择开源还是闭源大模型开源vs 闭源&#xff1a;两者并非选择题后记 每日一句正能量…

【网络】TCP协议的相关实验

TCP协议的相关实验 一、理解listen的第二个参数1、实验现象2、TCP 半连接队列和全连接队列3、关于listen的第二个参数的一些问题4、SYN洪水Ⅰ、什么是SYN洪水攻击Ⅱ、如何解决SYN洪水攻击&#xff1f; 二、使用Wireshark分析TCP通信流程 一、理解listen的第二个参数 在编写TCP…

有什么进销存软件,比较适合零售行业日常开单要求及库存记录?

本文将为大家总结一下对于进销存软件要求&#xff1a; 基础功能&#xff1a;可以日常开单、退换货处理、出入库进阶功能&#xff1a;电脑、手机数据同步&#xff0c;保障数据安全&#xff0c;可进行数据分析 其实无论是小型创业公司&#xff0c;还是一家大型企业&#xff0c;…

MathType2024最新word公式编辑器

使用word进行论文编写时&#xff0c;常需要使用公式编辑器&#xff0c;但有些word中并没有公式编辑器&#xff0c;这时应该怎么办呢&#xff1f;本文将围绕word里没有公式编辑器怎么办&#xff0c;word中的公式编辑器怎么用的内容进行介绍。 一、word里没有公式编辑器怎么办 …