概率密度函数(PDF)正态分布

概率密度函数(PDF)是一个描述连续随机变量取特定值的相对可能性的函数。对于正态分布的情况,其PDF有一个特定的形式,这个形式中包括了一个常数乘以一个指数函数,它假设误差项服从均值为0的正态分布:
正太分布(高斯分布)
p ( ϵ ( i ) ) = 1 2 π σ 2 exp ⁡ ( − ( ϵ ( i ) ) 2 2 σ 2 ) p(\epsilon^{(i)}) = \frac{1}{\sqrt{2\pi\sigma^2}} \exp\left(-\frac{(\epsilon^{(i)})^2}{2\sigma^2}\right) p(ϵ(i))=2πσ2 1exp(2σ2(ϵ(i))2)
各名词解释:
p ( ϵ ( i ) ) p(\epsilon^{(i)}) p(ϵ(i)):这部分表示给定误差 ϵ ( i ) \epsilon^{(i)} ϵ(i)的概率密度。

σ 2 \sigma^2 σ2:正态分布的形状完全由两个参数决定:均值( μ \mu μ)和方差( σ 2 \sigma^2 σ2)。均值决定了分布的中心位置,而方差(标准差的平方)决定了分布的离散程度。这里均值( μ \mu μ)都假设为0因此不讨论。详细解释一下 σ 2 \sigma^2 σ2

  1. σ 2 \sigma^2 σ2是分布宽度的度量, σ 2 \sigma^2 σ2的数值表示数据分布的离散程度: σ 2 \sigma^2 σ2越大,数据分布越分散; σ 2 \sigma^2 σ2越小,数据分布越集中(如上图中的钟形越瘦)。
  2. σ 2 \sigma^2 σ2的计算过程:
    a.假设你有一组数据 X = { x 1 , x 2 , . . . , x n } X = \{x_1, x_2, ..., x_n\} X={x1,x2,...,xn},且已知均值 μ \mu μ为0。
    b.计算每个数据点的平方: x i 2 x_i^2 xi2计算了每个数据点距离均值(0)的距离的平方。
    c.计算这些平方的平均值(即方差 σ 2 \sigma^2 σ2): σ 2 = 1 n ∑ i = 1 n x i 2 \sigma^2 = \frac{1}{n} \sum_{i=1}^{n} x_i^2 σ2=n1i=1nxi2(即 x i 2 x_i^2 xi2求和后平均)

1 2 π σ 2 \frac{1}{\sqrt{2\pi\sigma^2}} 2πσ2 1:这是正态分布概率密度函数的前缀,其中 σ 2 \sigma^2 σ2是方差。它的作用是确保概率密度函数(PDF)的积分——也就是函数下整个面积等于1。在数学上,这意味着对于连续概率分布,确保所有概率值的总和为1。

exp: e e e是一个重要的数学常数(自然对数的底数),约等于2.71828,而exp是 e e e的幂。exp用于计算概率的指数部分,确保了大多数数据点都集中在平均值附近,而远离均值的数据点则呈指数级减少,就是让曲线呈“钟形曲线(高斯分布)”。

− ( ϵ ( i ) ) 2 2 σ 2 -\frac{(\epsilon^{(i)})^2}{2\sigma^2} 2σ2(ϵ(i))2:这是exp指数函数内的幂,代表了 ϵ ( i ) \epsilon^{(i)} ϵ(i)偏离均值0的程度。

  1. 由于我们假设误差项 ϵ \epsilon ϵ均值为0,所以这里直接用 ϵ ( i ) \epsilon^{(i)} ϵ(i)。这个比例的平方表示了误差项的值距离均值(0)的距离的平方,然后除以 2 σ 2 {2\sigma^2} 2σ2来“标准化”这个距离。在正态分布中,这个距离的平方越大,观测到该误差的概率就越低。
  2. 这个过程与误差项 ϵ ( i ) \epsilon^{(i)} ϵ(i)的值(第 i i i个数据点的误差项)的平方成正比,这里的平方是必要的,因为我们对误差的大小感兴趣,而不管它是正的还是负的。平方确保了所有的误差值都是非负的,且更大的误差(无论正负)都会产生更大的平方值。
  3. 与方差 σ 2 {\sigma^2} σ2的两倍成反比,这里 σ 2 {\sigma^2} σ2表示整个数据集中的误差项的分布宽度。方差的两倍是概率密度函数的标准组成部分,用于“标准化”误差项的平方,这样不同的分布(具有不同的方差)就可以使用相同的函数形式。这里的乘以 1 2 σ 2 \frac{1}{2\sigma^2} 2σ21类似于计算出“相对”值而不是“绝对”值,在不改变误差项的方向的情况下,调整它的相对重要性。主要作用是:由于不同的数据集可能有不同的方差(即不同的误差分布宽度),我们需要有一种方式来标准化这些误差,使它们可以在统一的尺度上比较。
  4. − 1 2 σ 2 -\frac{1}{2\sigma^2} 2σ21:这个负号和分母 2 σ 2 {2\sigma^2} 2σ2一起工作,形成一个比例因子,表示一个衰减的过程,它反映了误差项 ϵ ( i ) \epsilon^{(i)} ϵ(i)相对于方差的大小。由于是负指数,误差项的平方越大, e e e的幂就越小,从而降低了该误差值的概率密度。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/208913.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

外汇天眼:新西兰监管机构永久性停止对David McEwen及与其相关的实体的命令

新西兰金融市场管理局(FMA)已对David Elgar McEwen及与其相关的实体(McEwen and Associates)发布了永久性停止令。 与McEwen先生相关的实体包括Stockfox Limited、Cosmopolitan Holdings Limited、Strategy Services Limited、Fun…

Ubuntu系统使用快速入门实践(七)——软件安装与使用(3)

Ubuntu系统使用快速入门实践系列文章 下面是Ubuntu系统使用系列文章的总链接,本人发表这个系列的文章链接均收录于此 Ubuntu系统使用快速入门实践系列文章总链接 下面是专栏地址: Ubuntu系统使用快速入门实践系列文章专栏 文章目录 Ubuntu系统使用快速…

在uniapp中,可以使用那些预定义的样式类

u-flex:设置元素为弹性布局。u-flex-v:设置元素为纵向弹性布局。u-flex-h:设置元素为横向弹性布局。u-p-10:设置元素的上下左右边距为10rpx。u-p-t-10:设置元素的上边距为10rpx。u-p-b-10:设置元素的下边距…

教育心得整理

压抑使人反抗,反抗就是报复,报复就会引起犯罪。要消灭犯罪,我们必须杜绝引起孩子报复心理的行为,更重要的是,我们一定要对孩子表现出来爱与尊重 限制批评的次数限制每次批评的范围限制每次批评的强度 当彼此的信任和…

第一百九十五回 连接蓝牙设备的细节

文章目录 1. 概念介绍2. 实现方法2.1 示例代码2.2 知识回顾2.3 实现方法3. 示例代码我们在上一章回中介绍了"分享三个使用TextField的细节"沉浸式状态样相关的内容,本章回中将介绍SliverList组件.闲话休提,让我们一起Talk Flutter吧。 1. 概念介绍 我们在本章回中…

机器学习之无监督学习:九大聚类算法

今天,和大家分享一下机器学习之无监督学习中的常见的聚类方法。 今天,和大家分享一下机器学习之无监督学习中的常见的聚类方法。 在无监督学习中,我们的数据并不带有任何标签,因此在无监督学习中要做的就是将这一系列无标签的数…

Spring Cloud Gateway中对admin端点进行认证

前言 我们被扫了一个漏洞,SpringBoot Actuator 未授权访问,漏洞描述是这样的: Actuator 是 springboot 提供的用来对应用系统进行自省和监控的功能模块,借助于 Actuator 开发者可以很方便地对应用系统某些监控指标进行查看、统计…

计算机基础知识65

cookie和session的使用 # 概念:cookie 是客户端浏览器上的键值对 # 目的:为了做会话保持 # 来源:服务端写入的,服务端再返回的响应头中写入,浏览器会自动取出来 存起来是以key value 形式,有过期时间、path…

STM32单片机项目实例:基于TouchGFX的智能手表设计(3)嵌入式程序任务调度的设计

STM32单片机项目实例:基于TouchGFX的智能手表设计(3)嵌入式程序任务调度的设计 目录 一、嵌入式程序设计 1.1轮询 1.2 前后台(中断轮询) 1.3 事件驱动与消息 1.3.1 事件驱动的概念 1.4 定时器触发事件驱动型的任…

golang游戏服务器 - tgf系列课程02

环境准备和服务创建 课程介绍了TGF框架的前期的准备工作,启动一个websocket网关服务,和大厅逻辑节点。 文章最后附有项目案例地址和视频教程地址,下期预告等信息安装第三方软件 tgf框架的服务发现依赖于Consul,所以我们需要先安装并启动Consul官网安装 :访问官网下载对应的包…

点云从入门到精通技术详解100篇-针对三维点云分类神经网络模型的不可感知对抗攻击

目录 前言 国内外研究现状 三维点云分类神经网络 三维点云传统攻击方法

C/C++ 实现动态资源文件释放

当我们开发Windows应用程序时,通常会涉及到使用资源(Resource)的情况。资源可以包括图标、位图、字符串等,它们以二进制形式嵌入到可执行文件中。在某些情况下,我们可能需要从可执行文件中提取自定义资源并保存为独立的…

vivado时序方法检查7

TIMING-25 &#xff1a; 千兆位收发器 (GT) 上的时钟波形无效 收发器输出管脚 <pin_name> 上或连接到该管脚的信号线上定义的时钟 <clock_name> 的波形与收发器设置不一 致&#xff0c; 或者缺少参考时钟定义。自动衍生时钟的周期为 <PERIOD> &#xf…

物联网后端个人第十四周总结

物联网方面进度 1.登陆超时是因为后端运行的端口和前端监听的接口不一样&#xff0c;所以后端也没有报错&#xff0c;将二者修改一致即可 2.登录之后会进行平台的初始化&#xff0c;但是初始化的时候会卡住,此时只需要将路径的IP端口后边的内容去掉即可 3.阅读并完成了jetlinks…

通过误差改变控制的两种策略

如果反馈误差越来越大&#xff0c;需要改变调节方向以减小误差并实现更好的控制。以下是两种常见的调节方向改变的方法&#xff1a; PID控制器中的积分限制&#xff1a;在PID控制中&#xff0c;积分项可以用来减小稳态误差。然而&#xff0c;当反馈误差持续增大时&#xff0c;积…

浪潮信息:数字化转型的策略与实践

在数字化浪潮的推动下&#xff0c;浪潮信息正致力于将计算创新推向新的高度。作为科技发展的排头兵&#xff0c;浪潮信息深知算力的重要性&#xff0c;因此不断探索前所未有的解决方案。在这个过程中&#xff0c;浪潮信息的研发人员和科技工作者如同探险家&#xff0c;勇敢地迎…

RocketMQ安装和使用

RocketMQ快速入门 下载RocketMQ 下载地址 环境要求 Linux64位系统 JDK1.8(64位) 安装RocketMQ 解压 unzip rocketmq-all-4.4.0-bin-release.zip启动RocketMQ 启动NameServer # 1.启动NameServer nohup sh bin/mqnamesrv & # 2.查看启动日志 tail -f ~/logs/rocke…

学会用bash在linux写脚本 (二)

接着上一章继续 数值的对比 判断语句 循环语句 22.5 比较、对比、判断 在写脚本时&#xff0c;有时需要做一些比较&#xff0c;例如&#xff0c;两个数字谁大谁小&#xff0c;两个字符串是否相同等。 做对比的表达式有[]、[[]]、test&#xff0c;其中[]和 test这两种表达式的…

如何通过3000个传感器帮助大型大学附属医院实现远程环境监测?

得益于ELPRO提供的可扩展、可信赖和可靠的环境监测解决方案&#xff0c;一家领先的大学研究医院系统在COVID-19新冠肺炎大流行初始迅速为员工远程工作做好了准备。 在本案例研究中&#xff0c;您将了解大城市的一家大型大学附属医院如何做到&#xff1a; 建立了远程温度控制数…

身份统一管理创新与优化 ——华为云OneAccess应用身份管理服务的2023年

2023年&#xff0c;随着云计算、物联网、人工智能等技术的快速发展&#xff0c;企业面临着数字化转型的巨大挑战与机遇。身份统一管理是企业数字化转型的基础&#xff0c;也是业务发展的关键。如何高效、安全、灵活地实现身份统一管理&#xff0c;成为企业亟待解决的首要课题。…