什么叫概率分布？

概率分布是描述随机变量可能取值及其相应概率的数学函数或规律。它提供了随机变量在各个取值上的概率信息，用于表示随机现象的不确定性和随机性。

概率分布可以分为两类：离散概率分布和连续概率分布。

1. 离散概率分布： 适用于描述离散随机变量的概率分布。它列举了随机变量可能的取值及其对应的概率。常见的例子包括二项分布、泊松分布等。

离散概率分布的例子：二项分布
二项分布：描述在一系列独立的重复试验中成功次数的概率分布。例如，一次抛硬币，如果我们关心的是正面朝上的次数，可以用二项分布来建模。

假设进行了n次抛硬币试验，每次试验有两个可能结果（正面或反面），成功定义为正面朝上。成功的次数（k）可以取0、1、2、…、n。那么，成功次数的概率分布就是二项分布。
在这里插入图片描述
上图展示了一个二项分布（Binomial Distribution）的概率质量函数（PMF）图，其中进行了10次独立的二元试验，每次成功的概率为0.5。

2. 连续概率分布： 适用于描述连续随机变量的概率分布。它通过概率密度函数（Probability Density Function, PDF）来表示随机变量在某一取值附近的概率。常见的例子包括正态分布、指数分布等。

连续概率分布的例子：正态分布
正态分布：描述自然界中许多随机变量的分布，也被称为高斯分布。它是一个连续概率分布，通常以钟形曲线的形式呈现。

正态分布由两个参数完全描述：均值（μ）和标准差（σ）。曲线的峰值位于均值处，标准差决定了曲线的宽度。

例如，人的身高可以近似地服从正态分布。如果我们知道某群体的平均身高和标准差，我们可以使用正态分布来估计不同身高区间的概率。
在这里插入图片描述这是身高的正态分布概率密度函数图。在这个例子中，平均身高μ=170 厘米，标准差 σ=5 厘米。横轴表示身高范围，纵轴表示概率密度。正态分布的曲线呈钟形，最高点对应于平均身高，标准差决定了曲线的宽度。