【小白学机器学习16】 概率论的世界观2: 从正态分布去认识世界

目录

1 从正态分布说起 

1.1 正态分布的定义

1.2 正态分布的名字

1.3 正态分布的广泛,和基础性

2 正态分布的公式和图形

2.1 正态分布

2.2 标准正态分布

3 正态分布的认识的3个层次

3.1 第1层次:个体的某个属性的样本值,服从正态分布

3.2 第2层次:抽样的误差,服从正态分布

3.3 第3层次:从标准正态分布去看,正态分布曲线就是概率曲线!

正态分布的本质就是概率

4 正态分布的特点

4.1 正态分布是客观的

4.2 万物不齐(从结果上看)

4.3 公平只是过程上的公平,而不能保证结果上的公平

4.4 钟形曲线,无限延申和逼近

4.5 中庸

4.6 动态平衡

4.7 规律是可用的,顺规律办事

4.7.1 不同的规律

4.7.2 使用规律

5 正态分布与标准值 ,概率

5.1 正态分布

5.2 正态分布的核心参数(所谓的6δ六西格玛)

5.3 关于标准值

5.4 关于标准正态分布

5.5 标准化数值得目的


正态分布,概率论都是一种世界观

1 从正态分布说起 

1.1 正态分布的定义

正态分布(Normal distribution),又称为常态分布或高斯分布,通常记作。其中, 是正态分布的数学期望(均值), 是正态分布的方差。μ = 0,σ = 1的正态分布被称为标准正态分布 [1]。

1.2 正态分布的名字

  • 正态分布 :Normal distribution
  • 自然分布
  • 常态分布
  • 高斯分布

1.3 正态分布的广泛,和基础性

  • 正态分布,在自然界广泛存在
  • 无论是宏观的世界,还是很多微观的研究
  • 因此,正态分布也称为了大家心里对概率估计的一个基础。
  • 比如
  1. 我们假设一个我们不知道的事件:包含2个基本事件,我们默认为是1:1,也就是50%概率
  2. 我们对于一个我们不知道的随机变量 ,我们会默认这个随机变量是符合正态分布的规律的

2 正态分布的公式和图形

2.1 正态分布

2.2 标准正态分布

  • 期望值μ=0,即曲线图象对称轴为Y轴,标准差σ=1条件下的正态分布,记为N(0,1)。

3 正态分布的认识的3个层次

3.1 第1层次:个体的某个属性的样本值,服从正态分布

  • 比如某个属性,
  • 按照样本的数据,横轴全部展开,为数值/数值区间
  • 根据不同的数值/数值区间,统计其频度,作为Y坐标
  • 可以看到,这个属性的频度图,就符合正态分布的曲线形状

3.2 第2层次:抽样的误差,服从正态分布

  • 比如某个属性,每次抽样100个数据,统计每次抽样的平均值
  • 连续抽样50次,
  • 横轴是这50次的平均值
  • 纵轴是这些平均值的频度/出现次数
  • 也是符合正态分布的

3.3 第3层次:从标准正态分布去看,正态分布曲线就是概率曲线!

正态分布的本质就是概率

  • 标准正态分布曲线
  • 在 -1标准差,+1标准差内,发生的概率是68%
  • 在 -2标准差,+2标准差内,发生的概率是95%
  • 在 -3标准差,+3标准差内,发生的概率是99%

4 正态分布的特点

4.1 正态分布是客观的

  • 世界是客观的,是不以人们的意志想法为转移的
  • 大地与山川,喷泉也是一个钟形曲线
  • 世界观是多样的,且可能在不同的情境下有用,比如地心说在日常的小范围围观环境下很实用。但是研究宇宙得用日心说。但是正态分布是我们遇到很多随机的对象都符合的一种分布类型。

4.2 万物不齐(从结果上看)

  • 万物不齐
  • 万物应该是按正态分布/自然分布的居多,所以一定是钟形曲线,大地也是平地+山峦
  • 喷泉也是一个钟形曲线
  • 因为万物不齐,所以需要单独的去认识每个事物。
  • 反之,否则之需要单独认识1个事物就可以认识整体了,这对于现实认知,显然是荒谬的。
  • 庄子:理想? 希望万物齐一
  • 孟子:事实求是,认为万物不齐。
  • 万物不齐天地事,大道之行是中庸。

4.3 公平只是过程上的公平,而不能保证结果上的公平

  • 结果的正确/正义无法保证
  • 只能从过程的正确/正义上去保证
  • 反而从辩证的角度看,正是因为,过程是公平的随机,结果才是不公平的

4.4 钟形曲线,无限延申和逼近

  • 正态分布/自然分布也说了这个问题,一定是中间大,两头小。
  • 从标准正态分布曲线上看,而且钟形曲线是无限的,趋近两边的极限无限接近但是永远无限延申下去,理论上可以覆盖所有情况。但是概率确是无限小。
  • 中间的比例是最高的,这个是基于正态分布来说
  • 越到两边,占比越少,只至长尾

4.5 中庸

  • 中间的比例是最高的,这个是基于正态分布来说
  • 中间这个值,很可能就是均值,且因为占比高,更具有代表性,
  • 越道两边,占比越少,只至长尾
  • 同样的X轴宽度下/标准差长度下,中间的聚集目的更高,面积大/概率高。两边概率低。
  • 而且如果不引入其他变量,那么正态分布的均值,就是预测将来发生值最好的值!

4.6 动态平衡

  • 钟形曲线,从顶上到两边,都是曲线,是不稳定的,不是静态平衡,只能是动态平衡。
  • 逆水行舟,不进则退。

4.7 规律是可用的,顺规律办事

4.7.1 不同的规律

  • 天之道,损有余而补不足
  • 人之道,损不足而补有余
  • 这是两种规律,规律是相对客观的,不变的,需要遵循,且可以利用模仿的。
  • 人们自发的,都是按照人之道而行事的。
  • 而人们也可以行天道,按天道的规律做事。从而对抗人之道的规律和结果。

4.7.2 使用规律

  • 从使用规律上来说,人定胜天,是人可以利用规律,我是这么理解的

5 正态分布与标准值 ,概率

5.1 正态分布

正态分布(Normal distribution),又称为常态分布或高斯分布,通常记作。其中, 是正态分布的数学期望(均值), 是正态分布的方差。μ = 0,σ = 1的正态分布被称为标准正态分布 [1]。

5.2 正态分布的核心参数(所谓的6δ六西格玛)

  • 第1: 均值
  • 第2: 标准差(sqrt-方差)
  • 第3: 隐藏参数:概率
  1. 概率就是把属于正态分布的样本值标准化后的图形了
  2. 隐藏的面积就是概率,和面积一一对应。
  3. 第3个概率,也被称为3δ原则,或者什么六西格玛原则:就是6δ。(听起来很高大上,实际就是正态分布)

5.3 关于标准值

  • 标准值=( x-u)/sd ,即以sd为量纲
  • 标准值,其实就是概率了,或者可以一一对应为概率了
  • 标准值,就是用 标准差来横向每个数值与 均值得距离,是n个多少个标准差。

5.4 关于标准正态分布

  • 标准正态分布,其实就是上面说的标准值的分布曲线。


5.5 标准化数值得目的

  • 是为了去除量纲得影响。
  • 标准值也是
  • 通过这种标准值得公式操作
  • 所有的数值,最后都是相关一套坐标系:标准正态分布的相同的量纲比较。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/57008.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Java应用程序的测试覆盖率之设计与实现(一)-- 总体设计

一、背景 作为测试,如何保证开发人员提交上来的代码都被测试覆盖到,是衡量测试质量的一个重要指标。 本系列文章将要说一说,如何搭建一套测试覆盖率的系统。 包括以下内容: jacoco agent采集执行覆盖率数据jacoco climaven集成jacoco:jacoco-maven-pluginant集成jacoco:…

【开源鸿蒙】OpenHarmony 5.0轻量系统最小开发环境搭建

【开源鸿蒙】OpenHarmony 5.0轻量系统最小开发环境搭建 一、写在前面——为什么写本篇内容二、准备工作——下载源码前的准备2.1 准备基础环境2.2 准备命令行工具2.3 配置git用户凭据 三、下载OpenHarmony轻量系统最小源码3.1 使用ssh协议下载(推荐)3.2 …

【Vue】Vue3.0(十五)Vue 3.0 中 hooks 的概念

🏡作者主页:点击! 🤖Vue专栏:点击! ⏰️创作时间:2024年10月22日21点50分 背景:在一些情况下,前台的组件是可以复用的,那这些复用的对象和数据,为…

Prompt Engineering (Prompt工程)

2 prompt工程2大原则 2.1 给出清晰&#xff0c;详细的指令 策略1&#xff1a;使用分割符清晰的指示输出的不同部分&#xff0c;比如"",<>,<\tag>等分隔符 策略2&#xff1a;指定一个结构化的输出&#xff0c;比如json,html等格式 策略3&#xff1a;要…

Oracle视频基础1.1.2练习

1.1.2 需求&#xff1a; 查询oracle组件和粒度大小&#xff0c; select component,granule_size from v$sga_dynamic_components;Oracle SGA 中组件和粒度大小查询详解 在 Oracle 数据库的内存结构中&#xff0c;SGA&#xff08;System Global Area&#xff0c;系统全局区&am…

基于SSM房屋租赁管理系统的设计与实现

前言 房屋租赁管理系统&#xff0c;不仅可以改善用户线下到租赁公司进行查看房屋类型的局面以及预约信息等&#xff0c;还可以提供管理效率&#xff0c;同时也可以增强网站的竞争力。利用房屋租赁管理系统&#xff0c;可以有效地提高系统的人事的效率和信息化水平&#xff0c;…

Gateway 统一网关

一、初识 Gateway 1. 为什么需要网关 我们所有的服务可以让任何请求访问&#xff0c;但有些业务不是对外公开的&#xff0c;这就需要用网关来统一替我们筛选请求&#xff0c;它就像是房间的一道门&#xff0c;想进入房间就必须经过门。而请求想要访问微服务&#xff0c;就必须…

sa-token 所有的异常都是未登录异常的问题

在使用satoken的时候&#xff0c;有这么一个问题&#xff0c;就是不管我是什么错误&#xff0c;都会弹出未登录异常&#xff0c;起初的时候我以为satoken的拦截器会拦截所有的异常&#xff0c;但是今后测试才发现忽略了一点&#xff0c;也是最重要最容易忽视的一点。 如果我现在…

解决JeecgBoot微服务通过Gateway访问Swagger资源出现“Knife4j文档请求异常”

1.问题描述 基于jeecgboot单体版本,参照官方推荐的纯微服务项目拆分指南,对jeecgboot项目进行微服务拆分,将gateway和system模块启动成功后,通过gateway访问访问Swagger接口文档,出现“Knife4j文档请求异常”,如下图: 2.问题定位: 1.浏览器F12打开控制台,查看异常请…

【React】React 18:新特性与重大更新解析

&#x1f308;个人主页: 鑫宝Code &#x1f525;热门专栏: 闲话杂谈&#xff5c; 炫酷HTML | JavaScript基础 ​&#x1f4ab;个人格言: "如无必要&#xff0c;勿增实体" 文章目录 React 18&#xff1a;新特性与重大更新解析并发渲染什么是并发渲染&#xff1f;…

Linux系统下串口AT指令控制EC20连接华为云物联网平台

一、前言 在当今万物互联的时代背景下&#xff0c;物联网技术的快速发展极大地推动了智能化社会的构建。作为其中的关键一环&#xff0c;设备与云端平台之间的通信变得尤为重要。本文介绍如何在Linux操作系统环境下&#xff0c;利用串口通信来实现EC20模块与华为云物联网平台的…

【JavaEE】【多线程】线程池

目录 一、线程池二、ThreadPoolExecutor类讲解2.1 构造方法2.1.1 corePoolSize和maximumPoolSize2.1.2 KeepAliveTime和unit2.1.3 workeQueue2.1.4 threadFactory2.1.5 handler 三、简易构造线程池四、自己实现一个简单线程池 一、线程池 线程池&#xff1a;线程池可以简单理解…

Vue.js 学习总结(11)—— Vue3 Hook 函数实战总结

前言 在 Vue 3 中&#xff0c;Hook 函数是一种特殊的函数&#xff0c;用于封装可重用的逻辑和状态管理。Hook 函数允许你在 Vue 组件中提取和复用逻辑&#xff0c;而不是将所有逻辑都放在组件的选项对象中。它们可以帮助你更好地组织代码&#xff0c;提高代码的可维护性和可测…

Elasticsearch 解析:倒排索引机制/字段类型/语法/常见问题

Elasticsearch 是一个分布式的开源搜索引擎&#xff0c;广泛用于全文搜索、分析和数据存储。它基于 Apache Lucene 构建&#xff0c;支持 RESTful 风格的 API&#xff0c;使得开发者能够高效地存储和检索数据。本文将详细讲解 Elasticsearch 的基本原理&#xff0c;特别是其倒排…

网页上的视频怎么下载下来?三种方法

分享三个简单好用的网页视频下载工具&#xff0c;值得使用&#xff01; 1.IDM IDM 是一款可以提高下载速度达5倍的工具&#xff0c;同时具有恢复、调度和组织下载的功能。如果由于网络问题或意外的电源中断&#xff0c;程序将恢复未完成的下载。 IDM 还具有一个完全功能的站点…

【Flask】一、安装与第一个测试程序

目录 Flask简介 安装Flask 安装pip&#xff08;Python包管理器&#xff09; 使用pip安装Flask 验证安装 创建Flask程序 创建应用 运行 访问测试 Flask简介 Flask是一个用Python编写的轻量级Web应用框架。它被设计为易于使用和扩展&#xff0c;使其成为构建简单网站或复…

【经典论文阅读11】ESMM模型——基于贝叶斯公式的CVR预估

传统的CVR模型&#xff08;也就是直接对conversion rate建模的模型&#xff09;在实际应用中面临两个问题&#xff08;样本选择偏差与数据稀疏性问题&#xff09;。为了解决这两个问题&#xff0c;本文提出ESMM模型。该模型巧妙地利用用户行为序列去建模这个问题&#xff0c;从…

解决SpringBoot项目启动错误:找不到或无法加载主类

如何解决SpringBoot项目的“找不到或无法加载主类”启动错误 在开发SpringBoot应用时&#xff0c;经常可能会遇到一个启动错误&#xff1a;“错误&#xff1a;找不到或无法加载主类 com.example.controller.demo.DemoApplication”。本文将介绍三种解决这一问题的方法。 方法…

微信小程序中点击搜素按钮没有反应,可能是样式问题(按钮被其他元素覆盖或遮挡)

文章目录 1. 确认 bindtap 绑定在正确的元素上2. 检查是否有遮挡或重叠元素3. 检查 this 上下文绑定问题4. 清除微信小程序开发者工具的缓存5. 用微信开发者工具查看事件绑定6. 确保 handleSearch 没有拼写错误进一步调试 1、searchResults.wxml2、searchResults.wxss3、search…

偷懒总结篇|贪心算法|动态规划|单调栈|图论

由于这周来不及了&#xff0c;先过一遍后面的思路&#xff0c;具体实现等下周再开始详细写。 贪心算法 这个图非常好 122.买卖股票的最佳时机 II(妙&#xff0c;拆分利润) 把利润分解为每天为单位的维度&#xff0c;需要收集每天的正利润就可以&#xff0c;收集正利润的区间…