目录
- cdf
- 累积分布函数 (CDF)
- ppf
- 百分位点函数 (PPF)
- 区别与联系
- 示例
- 关系和区别
cdf
累积分布函数 (CDF)
定义:
- 累积分布函数 F ( x ) F(x) F(x) 给出随机变量 X X X 小于或等于某个值 x x x 的概率。
- 数学定义: F ( x ) = P ( X ≤ x ) F(x) = P(X \leq x) F(x)=P(X≤x)
性质:
- 非递减性:累积分布函数是单调非递减的。
- 值域:CDF 的值域是 [ 0 , 1 ] [0, 1] [0,1]。
- 边界条件:
- lim x → − ∞ F ( x ) = 0 \lim_{x \to -\infty} F(x) = 0 limx→−∞F(x)=0
- lim x → ∞ F ( x ) = 1 \lim_{x \to \infty} F(x) = 1 limx→∞F(x)=1
- 右连续性:CDF 是右连续的。
用途:
- 用于计算某个值以下的累积概率。
- 用于绘制分布的累积分布图。
ppf
百分位点函数 (PPF)
定义:
- 百分位点函数(也称逆累积分布函数或量函数) F − 1 ( p ) F^{-1}(p) F−1(p)给出累积分布函数值为 p p p 时对应的随机变量 X X X 的值。
- 数学定义: F − 1 ( p ) = inf { x ∈ R : F ( x ) ≥ p } F^{-1}(p) = \inf \{ x \in \mathbb{R} : F(x) \ge p \} F−1(p)=inf{x∈R:F(x)≥p}
性质:
- 单调性:PPF 是单调非减的。
- 值域:PPF 的值域是随机变量的取值范围。
- 边界条件:
- F − 1 ( 0 ) = inf { x ∈ R } F^{-1}(0) = \inf \{ x \in \mathbb{R} \} F−1(0)=inf{x∈R}
- F − 1 ( 1 ) = sup { x ∈ R } F^{-1}(1) = \sup \{ x \in \mathbb{R} \} F−1(1)=sup{x∈R}
用途:
- 用于根据给定的概率计算对应的随机变量值。
- 用于从给定分布中生成随机样本。
区别与联系
累积分布函数(CDF)和百分位点函数(PPF)是概率论和统计学中两个重要的函数,它们之间有着密切的关系,但用途和计算方式不同。
示例
我们可以通过一个具体的示例来展示 CDF 和 PPF 的关系。
以下是使用 scipy
库计算正态分布的 CDF 和 PPF 的示例代码:
import numpy as np
import scipy.stats as stats
import matplotlib.pyplot as plt# 设置正态分布的参数
mu, sigma = 0, 1# 生成数据点
x = np.linspace(-3, 3, 1000)
p = np.linspace(0, 1, 1000)# 计算正态分布的 CDF
cdf = stats.norm.cdf(x, loc=mu, scale=sigma)# 计算正态分布的 PPF
ppf = stats.norm.ppf(p, loc=mu, scale=sigma)# 绘制 CDF 和 PPF 图像
fig, (ax1, ax2) = plt.subplots(1, 2, figsize=(12, 6))# 绘制 CDF
ax1.plot(x, cdf, label='CDF')
ax1.set_title('Cumulative Distribution Function (CDF)')
ax1.set_xlabel('x')
ax1.set_ylabel('Probability')
ax1.grid()
ax1.legend()# 绘制 PPF
ax2.plot(p, ppf, label='PPF', color='r')
ax2.set_title('Percent Point Function (PPF)')
ax2.set_xlabel('Probability')
ax2.set_ylabel('x')
ax2.grid()
ax2.legend()plt.tight_layout()
plt.show()
关系和区别
-
计算方向:
- CDF 从值到概率:给定一个值 x x x,计算 P ( X ≤ x ) P(X \leq x) P(X≤x)。
- PPF 从概率到值:给定一个概率 p p p,计算满足 P ( X ≤ x ) = p P(X \leq x) = p P(X≤x)=p 的值 x x x。
-
用途:
- CDF 用于计算累积概率,用于统计推断和概率计算。
- PPF 用于计算分位点,用于生成随机样本和概率反推。
-
关系:
- PPF 是 CDF 的逆函数: F − 1 ( F ( x ) ) = x F^{-1}(F(x)) = x F−1(F(x))=x 和 F ( F − 1 ( p ) ) = p F(F^{-1}(p)) = p F(F−1(p))=p。
通过理解 CDF 和 PPF 的定义、性质和用途,可以更好地进行概率分布的分析和应用。