概率论中PDF、PMF和CDF的区别与联系

在概率论中,经常出现PDF、PMF和CDF,那么这三者有什么区别与联系呢?

1. 概念解释

  • PDF:概率密度函数(probability density function), 在数学中,连续型随机变量的概率密度函数(在不至于混淆时可以简称为密度函数)是一个描述这个随机变量的输出值,在某个确定的取值点附近的可能性的函数。

常见的离散随机变量分布的PMF函数:伯努利分布,二项分布,泊松分布。

  • PMF : 概率质量函数(probability mass function), 在概率论中,概率质量函数是离散随机变量在各特定取值上的概率。

常见的连续随机变量分布的PDF函数:均匀分布,指数分布,Gamma分布和正态分布等。

  • CDF : 累积分布函数 (cumulative distribution function),又叫分布函数,是概率密度函数的积分,能完整描述一个实随机变量X的概率分布。

2. 数学表示

2.1 PDF

如果XXX是连续型随机变量,定义概率密度函数为fX(x)f_X(x)fX(x),用PDF在某一区间上的积分来刻画随机变量落在这个区间中的概率,即
在这里插入图片描述

2.2 PMF

如果XXX离散型随机变量,定义概率质量函数为fX(x)f_X(x)fX(x),PMF其实就是高中所学的离散型随机变量的分布律,即
在这里插入图片描述
比如对于掷一枚均匀硬币,如果正面令X=1X=1X=1,如果反面令X=0X=0X=0,那么它的PMF就是
在这里插入图片描述

2.3 CDF

不管是什么类型(连续/离散/其他)的随机变量,都可以定义它的累积分布函数,有时简称为分布函数。

  • 对于连续型随机变量,显然有:
    在这里插入图片描述
    那么CDF就是PDF的积分,PDF就是CDF的导数。

  • 对于离散型随机变量,其CDF是分段函数,比如举例中的掷硬币随机变量,它的CDF为:
    在这里插入图片描述

3.概念分析

根据上述,我们能得到以下结论:

  • PDF是连续变量特有的,PMF是离散随机变量特有的;
  • PDF的取值本身不是概率,它是一种趋势(密度)只有对连续随机变量的取值进行积分后才是概率,也就是说对于连续值确定它在某一点的概率是没有意义的;
  • PMF的取值本身代表该值的概率。

4.分布函数的意义

我们从两点来分析分布函数的意义:

4.1 为什么需要分布函数?

对于离散型随机变量,可以直接用分布律来描述其统计规律性;而对于连续型随机变量(非离散型的随机变量),我们无法一一列举出随机变量的所有可能取值,所以它的概率分布不能像离散随机变量那样用分布律进行描述。于是引入PDF,用积分来求随机变量落入某个区间的概率

分布律(PMF)不能描述连续型随机变量,密度函数(PDF)不能描述离散随机变量,因此需要找到一个统一方式描述随机变量统计规律,这就有了分布函数

另外,在现实生活中,有时候人们感兴趣的是随机变量落入某个范围内的概率是多少,如掷骰子的数小于3点的获胜,那么考虑随机变量落入某个区间的概率就变得有现实意义了,因此引入分布函数很有必要。

4.2 分布函数的意义

分布函数F(x)F ( x )F(x)在点x xx处的函数值表示XXX落在区间(−∞,x](−\infty,x](,x]内的概率,所以分布函数就是定义域为RRR的一个普通函数,因此我们可以把概率问题转化为函数问题,从而可以利用普通的函数知识来研究概率问题,增大了概率的研究范围。

5.参考文献

概率中的PDF,PMF,CDF
http://www.dataguru.cn/thread-150756-1-1.html
https://www.zhihu.com/question/23022012
https://www.zhihu.com/question/36853661
https://www.zhihu.com/question/21911186
http://wenku.baidu.com/view/823a0bb9f111f18582d05a14.html

————————————————
版权声明:本文为CSDN博主「秦刚刚」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/yzcjwddbdgg/article/details/88063677

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/345558.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

随机游走 Random Walk

随机游走(英语:Random Walk,缩写为 RW),是一种数学统计模型,它是一连串的轨迹所组成,其中每一次都是随机的。[1][2]它能用来表示不规则的变动形式,如同一个人酒后乱步,所…

wald

1. Wald’s equation Let (Xn)n∈N(X_n)_{n∈ℕ}(Xn​)n∈N​ be a sequence of real-valued, independent and identically distributed (i.i.d.) random variables and let NNN be a nonnegative integer-value random variable that is independent of the sequence (Xn)n∈…

Java 11就在这里,您准备好进行切换了吗?

在应该将Java 9发行版“震撼我们的世界”一年之后,我们实际上一直在等待的LTS版本终于来了 我们知道,大多数开发人员,团队,公司等尚未通过Java 8进行更新。 即使去年发布了模块Java 9,然后在3月又发布了Java 10。 令…

随机变量和的分布—卷积公式distribution convolution的应用

在概率论里面,大家都会碰到一类问题,就是涉及到这样一类题目: 一般来说,这种类型的题目有两种方法来解决,第一种就是二重积分法;第二种就是应用卷积公式。下面我给大家列出了卷积公式: 但是…

Fluent Design单选按钮,复选框,选择框,Java菜单

这次我对JMetro进行了重大更新。 3.8版引入了以下新的Fluent Design (FDS)启发风格(深色和浅色)和更新: 新的单选按钮样式; 复选框的新样式; 菜单的新样式; 更新了上下文菜单的样…

stability condition in queueing system

https://www.unf.edu/~cwinton/html/cop4300/s09/class.notes/e1-Stability.pdf

undertow服务器分析_进入Undertow Web服务器

undertow服务器分析随着Java EE 7的到来以及处理诸如Web Sockets API和HTTP升级(例如EJB over HTTP)之类的高级功能的要求,WildFly开发团队已经做出了重要决定。 在长期致力于JBoss Web服务器(Apache Tomcat的一个分支&#xff09…

matlab中的rng函数

一、matlab中的随机函数有:rand、randn 1、rand() 功能:生成0-1之间的伪随机数 e.g. rand(3) 生成一个3*3的0-1之间的伪随机数矩阵 2、randn() 功能:生成标准正态分布的伪随机数(均值为0&am…

inf sup上下确界与 min, max 的区别

inf 是 infimum 的简称,sup 是 supremum 的简称。 使用 inf 或 sup 总能保证一个函数的 inf 或 sup 存在,而函数的 min 或 max 有时候不存在。 inf 的定义:一个集合最大的下界 下确界:infimum,简写为 inf&#xff08…

在边缘,作为网关或在网格中构建控制平面以管理Envoy代理的指南

最近, Envoy已成为流行的网络组件。 马特克莱因( Matt Klein )在几年前写了一个博客,内容涉及Envoy的动态配置API,以及它如何成为Envoy的采用曲线向右移的原因之一。 他称该博客为“通用数据平面API”。 由于有许多其他…

java编译器分析_Java反编译器的剖析

java编译器分析简单地说,反编译器尝试将源代码转换为目标代码。 但是有很多有趣的复杂性-Java源代码是结构化的; 字节码当然不是。 而且,转换不是一对一的:两个不同的Java程序可能会产生相同的字节码。 我们需要应用试探法以合理地…

各种各样的数

数的类别 数可以被分类为数系的集合内。对于以符号表示数的不同方式,则请看记数系统。 自然数 主条目:自然数 最常用的数为自然数,有些人指正整数,有些人则指非负整数。前者多在数论中被使用,而在集合论和计算机科学…

JDK 11上的JavaFX

在第11版发布之后,人们对JavaFX与JDK的解耦感到百感交集。 我们中的许多人认为现在是时候告别JavaFX并改用另一种GUI技术了,而另一些人对此情况感到高兴。 他们认为,将JavaFX与Oracle分离开来,并致力于将其开发为开源社区驱动的项…

HMM(隐马尔可夫模型)

1.什么是熵(Entropy) 简单来说,熵是表示物质系统状态的一种度量,用它老表征系统的无序程度。熵越大,系统越无序,意味着系统结构和运动的不确定和无规则;反之,,熵越小,系统越有序&am…

Java NIO教程

1.简介 Java NIO是从Java 1.4引入的库。 自从Java NIO推出以来,它提供了另一种方法来处理I / O和网络事务。 它被认为是Java网络和Java IO库的替代方法。 开发Java NIO的目的是使输入和输出的事务异步和非阻塞。 阻塞和非阻塞IO的概念将在后面的部分中介绍。 目录…

关于判断函数凸或凹以及最优化的问题

大部分情况下都转换为凸优化问题&#xff0c;并通过最优化方法来求解&#xff0c;因此了解相关知识就显得尤为重要了。 主要内容&#xff1a; 问题引出凸集凸函数凸优化最优化 1、问题引出 在n维空间中&#xff0c;对于任意两个点&#xff0c;对于0<μ<1&#xff0c;…

javafx弹出式窗口_JavaFX 8的弹出式编辑器

javafx弹出式窗口在过去的几个月中&#xff0c;我很高兴与JavaFX 8一起使用&#xff0c;以便为计划和调度应用程序实现复杂的用户界面。 所需的功能之一是执行“就地”编辑的方法&#xff0c;即快速编辑用户选择对象的某些基本属性的方法。 遵循“如果您无法创新&#xff0c;就…

随机访问MAC协议 知识梳理(ALOHA,CSMA,CSMA/CD,CSMA/CA)

0、随机访问MAC的协议 数据链路层动态随机分配信道时对随机访问MAC协议&#xff1a;ALOHA&#xff0c;CSMA&#xff0c;CSMA/CD&#xff0c;CSMA/CA ALOHA&#xff0c;CSMA&#xff0c;CSMA/CD的区别仅在于是否对信道进行监听和是否有碰撞检测&#xff1a; 1、ALOHA&#xf…

认识CUBA平台的CLI

毫无疑问&#xff0c;软件开发人员&#xff08;尤其是Java开发人员&#xff09;的世界充满了键盘狂热者&#xff0c;最好是一次单击即可键入10-15个字母。 而且我们的社区也不例外&#xff0c;因此经常有人问我们“如何在没有CUBA Studio的情况下启动项目&#xff1f;”之类的问…

将matlab中数据输出保存为txt或dat格式

一、将matlab中数据输出保存为txt或dat格式的三种方法。 第一种方法&#xff1a;save&#xff08;最简单基本的&#xff09; 具体的命令是&#xff1a;用save *.txt -ascii x x为变量 *.txt为文件名,该文件存储于当前工作目录下&#xff0c;再打开就可以打开后,数据有可能是以…