【小白学机器学习31】 大数定律,中心极限定理,标准正态分布与概率的使用

目录

1 正态分布相关的2个相关定理

1.1 大数定律:(证明了)分布的稳定性

1.2 中心极限定理:(证明了)分布的收敛性

2 使用标准差和概率的2种思路

2.1 标准正态分布的曲线

2.2 两种使用方式

2.3 第1种:按整数倍标准差δ 作为标准使用

2.3.1   比如3δ原则 /6西格玛管理

2.3.2 还有LCL, UCL管理

2.2 第2种:按比较整的概率如95%对应的标准差使用

3 应用举例1

4 应用举例2:造成误差的原因不是样本数占总体的比例,而是样本的绝对数量!


关于正态分布,具体应用

1 正态分布相关的2个相关定理

1.1 大数定律:(证明了)分布的稳定性

  • 大量试验结果稳定性
  • 频率的稳定性,
  • 伯努利大数定律:样本数多n变大,某个事件发生的频度 =单次试验内发生的概率
  • 泊松大数定律:   样本数多n变大,样本平均值估计 =总体平均值

1.2 中心极限定理:(证明了)分布的收敛性

  • 分布的收敛性
  • 随机变量(如多次取样的均值)会逐渐符合某一分布:正态分布
  • 二项分布的极限分布是正态分布
  • 无论一组变量独立同分布,不管本身符合什么分布,但是有u和 δ^2。这组变量的样本平均数(多次抽样的平均数分分布)就服从 u和 δ^2/N的正态分布

2 使用标准差和概率的2种思路

2.1 标准正态分布的曲线

  • 标准正态分布曲线,曲线下的面积可以表示概率
  • 曲线上的每个点,都是Xi值的标准值
  • 标准值=xi-u/sd

2.2 两种使用方式

  • 我们根据不同的需要,确定了我们使用 2δ 还是2.58δ
  • 如果有可能,我们使用其他标准的δ 都有可能,关键是根据需求来
  1. 当我们需要以整数δ为标准来看概率时,选择 δ,2δ,3δ等
  2. 当我们需要以比较整的概率时比如95%,99%时,比如做假设检验的适合,选择 1.96δ,2.58δ等

2.3 第1种:按整数倍标准差δ 作为标准使用

按照 -3δ,-2δ,-1δ,1δ,2δ,3δ 这样的整数倍δ来划分区间

  • 3δ,49.8%,99.99%
  • 2.58δ,49.5%,99%
  • 2δ,47.7%,95.45%
  • 1.96δ,47.5%,95%
  • δ,34.1%,68.5%
  • -δ,34.1%,68.5%
  • -1.96δ,47.5%,95%
  • -2δ,47.7%,95.45%
  • -2.58δ,49.5%,99%
  • -3δ,49.8%,99.99%

2.3.1   比如3δ原则 /6西格玛管理

  • 标准正态分布与概率,3δ原则
  • 不同的标准差δ对应不同的概率
  • 按照几倍δ,去找对应的概率,68.5%,95.45%,99.99%等


2.3.2 还有LCL, UCL管理

  • LCL“Low control limit  一般对应-3δ
  • UCL:UP control limit    一般对应+3δ

2.2 第2种:按比较整的概率如95%对应的标准差使用

按概率 90% 95% 99%等比较整的概率去划分标准正态分布的区间

  • 3δ,49.8%,99.99%
  • 2.58δ,49.5%,99%
  • 2δ,47.7%,95.45%
  • 1.96δ,47.5%,95%
  • δ,34.1%,68.5%
  • -δ,34.1%,68.5%
  • -1.96δ,47.5%,95%
  • -2δ,47.7%,95.45%
  • -2.58δ,49.5%,99%
  • -3δ,49.8%,99.99%


 

3 应用举例1

  • 使用样本均值 + 总体的标准差,去估计 总体均值的范围
  • 使用样本均值 + 总体的标准差(样本标准差),去估计 总体均值的范围

我们如果只有1个样本,少数样本,虽然不能直接推算总体样本,但是可以这么估计范围。
比如在95%区间内
总体均值-1.96*标准差/sqrt(n) <= 样本平均值<=总体均值-1.96*标准差/sqrt(n)
因此
总体平均值<=样本平均值+1.96*标准差/sqrt(n)
总体平均值>=样本平均值-1.96*标准差/sqrt(n)

当样本数量n一直增大后
总体平均值<=样本平均值+1.96*标准差/sqrt(n)=样本平均值+0
总体平均值>=样本平均值-1.96*标准差/sqrt(n) =样本平均值-0
总体平均值=样本平均值

如果范围从95%→99%后,形象的看为什么置信区间变大了
总体平均值<=样本平均值+2.58 *标准差/sqrt(n)
总体平均值>=样本平均值-2.58 *标准差/sqrt(n)
范围变大,95%-99%,也就是置信区间变大了。而拒绝的空间α就很小了。

这个计算实际存在理论上的问题。但是实际上我们容易得到样本均值,但很难得到总体标准差,而如果用样本的标准差去替代总体的,也是个办法,因为样本方差的分母从N改为(N-1)=总体方差,所以还是可以行得通的,但是肯定是有误差的。

4 应用举例2:造成误差的原因​​​​​​​不是样本数占总体的比例,而是样本的绝对数量!

  • 一个更奇怪的公式
  • 95%时
  • 样本p-1.96*sqrt((N-n)/(N-1)*p*(1-p)/n) <总体P< 样本p+1.96*sqrt((N-n)/(N-1)*p*(1-p)/n)
  • 而(N-n)/(N-1) 样本数量n比较小时,趋近于1,故意忽略
  • 样本p-1.96*sqrt(p*(1-p)/n) <总体P< 样本p+1.96*sqrt(p*(1-p)/n)

  • 造成误差的原因
  • 不是样本数占总体的比例,而是样本的绝对数量!
  • 反常识!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/884796.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

springcloud通过MDC实现分布式链路追踪

在DDD领域驱动设计中&#xff0c;我们使用SpringCloud来去实现&#xff0c;但排查错误的时候&#xff0c;通常会想到Skywalking&#xff0c;但是引入一个新的服务&#xff0c;增加了系统消耗和管理学习成本&#xff0c;对于大型项目比较适合&#xff0c;但是小的项目显得太过臃…

R语言结构方程模型(SEM)

原文链接&#xff1a;R语言结构方程模型&#xff08;SEM&#xff09;https://mp.weixin.qq.com/s?__bizMzUzNTczMDMxMg&mid2247624956&idx4&sn295580a016a86cfee8ee2277c93e32d5&chksmfa8da91bcdfa200da897f1f267492039865bdfe5d75a1c6e6df92ff5005e0eb5cc33a…

国标GB28181视频平台EasyCVR私有化视频平台工地防盗视频监控系统方案

一、方案背景 在当代建筑施工领域&#xff0c;安全监管和防盗监控是保障工程顺利进行和资产安全的关键措施。随着科技进步&#xff0c;传统的监控系统已不足以应对现代工地的安全挑战。因此&#xff0c;基于国标GB28181视频平台EasyCVR的工地防盗视频监控系统应运而生&#xf…

labview学习总结

labview学习总结 安装labview的特点一、图形化编程范式二、并行执行机制三、硬件集成能力四、应用领域优势五、开发效率六、系统集成能力**labview基本组成示意图****常用程序结构图解**结语 基础知识介绍界面前后面板的概念平铺式和层叠式 帧的概念结构类型顺序结构for循环whi…

《YOLO 目标检测》—— YOLO v4 详细介绍

文章目录 一、整体网络结构1. YOLO v4 网络结构图2.对之前版本改进创新的概括 二、对改进创新部分的具体介绍1. 输入端创新2. Backbone主干网络创新CSPDarknet53Mish激活函数Dropblock正则化 3. 特征融合创新SPP模块PAN结构 4. Prediction输出层创新CIOU LossDIoU_NMS&#xff…

C# 独立线程

文章目录 前言使用多线程注意事项:1.线程安全性:2.线程同步:3.避免主线程的耗时操作:4.使用线程池:5.注意线程的生命周期管理:6.正确处理线程间通信:7.考虑线程的优先级和调度:了解操作系统对线程的调度策略,合理设置线程的优先级,确保关键线程能够优先执行。8.异常处…

Linux之初体验

目录 第1关&#xff1a;1-Linux初体验 第2关&#xff1a;1-Linux常用命令 第3关&#xff1a;1-Linux 查询命令帮助语句 第4关&#xff1a;2--查询命令-locate 第5关&#xff1a;2--查询命令-which/whereis 第6关&#xff1a;2--查询命令-find 第7关&#xff1a;3-Linux文…

动态规划 —— dp问题-按摩师

1. 按摩师 题目链接&#xff1a; 面试题 17.16. 按摩师 - 力扣&#xff08;LeetCode&#xff09;https://leetcode.cn/problems/the-masseuse-lcci/description/ 2. 算法原理 状态表示&#xff1a;以某一个位置为结尾或者以某一个位置为起点 dp[i]表示&#xff1a;选择到i位置…

【react】基础知识点学习

1. 创建项目 npm install -g create-react-app npx create-react-app my-app cd my-app npm startindex.js为入口文件&#xff0c;App.js为根组件。 如何将react应用挂载在页面上&#xff1f; 将App组件渲染到id为root的DOM元素中 2. JSX JSX是|avaScript和XML(HTML)的缩写…

小张求职记二:完善简历

金色的夕阳将校园染上一层温暖的橘色&#xff0c;操场上&#xff0c;足球队员们挥洒着汗水&#xff0c;欢笑声在空气中回荡&#xff0c;远处的图书馆里&#xff0c;学生们埋头苦读&#xff0c;偶尔传出翻书的声音。一切都是那么美好&#xff0c;仿佛时间都静止在了这美好的时刻…

word及Excel常见功能使用

最近一直在整理需规文档及表格&#xff0c;Word及Excel需要熟练使用。 Word文档 清除复制过来的样式 当复制文字时&#xff0c;一般会带着字体样式&#xff0c;此时可选中该文字 并使用 ctrlshiftN 快捷键进行清除。 批注 插入->批注&#xff0c;选中文本 点击“批注”…

在Microsoft Outlook日历中添加多个时区

在Microsoft Outlook日历中添加多个时区 1.单击Outlook中的文件选项卡&#xff0c;单击选项 2.左侧菜单中选择日历 3.向下滚动到时区部分&#xff0c;并标记当前时区&#xff0c;比如China 4.选中“显示第二个时区”框 5.选择第二个时区并给它一个标签&#xff0c;比如Germa…

vue组件在项目中的常用业务逻辑(3)

获取完后台接口数据后&#xff0c;需将数据在页面中进行动态展示。 一、在getters中简化数据&#xff1a; 二、在search>index.vue中写计算属性&#xff0c;实现将接口的goodsList模块数据展示在vue的search上&#xff1a; 三、1.用v-for循环数据&#xff0c;一共十个&…

从传感器到清洁力提升,灵途科技推动家电智能化发展

双十一第一波预售刚结束&#xff0c;第二波预售活动又火热开启。得益于政府补贴和平台优惠的双重带动&#xff0c;扫地机等高端智能家电需求暴增。 今年&#xff0c;各大电商平台不再单纯追求“全网最低价”&#xff0c;而是在低价基础上注重提升用户的综合体验。家电机器人品…

基于STM32的智能温室环境监测与控制系统设计(代码示例)

一、项目概述 在现代农业中&#xff0c;智能大棚能够通过环境监测、数据分析和自动控制等技术手段&#xff0c;实现对作物生长环境的精细化管理。本项目旨在设计一个基于STM32单片机的智能大棚系统&#xff0c;能够实时监测光照强度、空气温湿度及土壤湿度&#xff0c;并根据设…

Python 继承、多态、封装、抽象

面向对象编程&#xff08;OOP&#xff09;是 Python 中的一种重要编程范式&#xff0c;它通过类和对象来组织代码。OOP 的四个核心概念是继承&#xff08;Inheritance&#xff09;、多态&#xff08;Polymorphism&#xff09;、封装&#xff08;Encapsulation&#xff09;和数据…

详解CRC校验原理以及FPGA实现

文章目录 一、什么是CRC校验&#xff1f;二、实现CRC校验原理以及步骤2.1 用多项式表示二元码数据2.2 选择一个生成多项式作为校验2.3 计算CRC校验码 三、CRC判断数据是否错误的原理以及步骤3.1 将收到的数据与生成多项式求余3.2 数据发生错误再进行CRC校验判断 四、FPGA实现CR…

大模型学习笔记------CLIP模型解读与思考

大模型学习笔记------CLIP模型解读与思考 1、为什么提出CLIP模型2、CLIP模型详解3、CLIP模型的重要意义 上文已经讲到&#xff0c;我认为多模态的大模型是最有前途的大模型&#xff0c;首先学习的就是CLIP这个模型。 CLIP&#xff08;Contrastive Language-Image Pretraining&…

sass @mixin @extend

sass中的mixin混入 和 extend继承 mixin 需要使用include mixin-name&#xff1b; 就可以直接使用 extend 继承 可以直接继承通用的css 不用再单独去添加class类型 使用示例 .button-default { background-color: #f00; color: #fff; padding: 10px; border: none; borde…

《IMM交互式多模型滤波MATLAB实践》专栏目录,持续更新……

专栏链接&#xff1a;https://blog.csdn.net/callmeup/category_12816762.html 专栏介绍 关于IMM的例程 双模型EKF&#xff1a; 【逐行注释】基于CV/CT模型的IMM|MATLAB程序|源代码复制后即可运行&#xff0c;无需下载三模型EKF&#xff1a; 【matlab代码】3个模型的IMM例程&…