目录
- 正态、
- 威布尔、
- 指数分布、
- 3.1 概念介绍
- 概率密度函数(PDF)
- 累积分布函数(CDF)
- 性质
- 应用
- 3.2 参数及绘图
- 参数
- 概率密度函数(PDF)
- 累积分布函数(CDF)
- 绘图
- 图像解读
- 3.3 指数分布拟合
- 代码解读
- 指数分布的参数
- 指数分布拟合
- 例子
- 伽马分布、
- 对数正态分布介绍
正态、
威布尔、
指数分布、
3.1 概念介绍
指数分布(Exponential Distribution)是连续概率分布的一种,常用于描述时间间隔或距离等连续变量。它的概率密度函数(PDF)和累积分布函数(CDF)如下所示:
概率密度函数(PDF)
对于参数 λ > 0 \lambda > 0 λ>0,指数分布的概率密度函数为:
f ( x ; λ ) = { λ e − λ x x ≥ 0 0 x < 0 f(x; \lambda) = \begin{cases} \lambda e^{-\lambda x} & x \ge 0 \\ 0 & x < 0 \end{cases} f(x;λ)={λe−λx0x≥0x<0
这里, λ \lambda λ 是分布的参数,称为速率参数,它决定了分布的形状。
累积分布函数(CDF)
指数分布的累积分布函数为:
F ( x ; λ ) = { 1 − e − λ x x ≥ 0 0 x < 0 F(x; \lambda) = \begin{cases} 1 - e^{-\lambda x} & x \ge 0 \\ 0 & x < 0 \end{cases} F(x;λ)={1−e−λx0x≥0x<0
性质
- 无记忆性:指数分布是无记忆的,即对于任何 s , t ≥ 0 s, t \ge 0 s,t≥0,有
P ( X > s + t ∣ X > s ) = P ( X > t ) P(X > s + t \mid X > s) = P(X > t) P(X>s+t∣X>s)=P(X>t) - 均值和方差:如果 X ∼ Exponential ( λ ) X \sim \text{Exponential}(\lambda) X∼Exponential(λ),则
- 均值: E [ X ] = 1 λ \mathbb{E}[X] = \frac{1}{\lambda} E[X]=λ1
- 方差: Var ( X ) = 1 λ 2 \text{Var}(X) = \frac{1}{\lambda^2} Var(X)=λ21
应用
指数分布在许多领域都有广泛应用,例如:
- 排队论:用于描述客户到达间隔时间。
- 可靠性工程:用于描述设备无故障运行时间。
- 生存分析:用于描述某事件发生的时间间隔。
3.2 参数及绘图
让我们更深入地了解指数分布的参数,并通过绘图来展示其特性。
参数
指数分布的关键参数是速率参数 λ \lambda λ。这个参数决定了事件发生的速率。具体来说:
- 速率参数 λ \lambda λ:表示事件发生的速率。单位时间内发生事件的期望次数。通常, λ \lambda λ 值越大,事件发生得越快。
- 均值 μ = 1 λ \mu = \frac{1}{\lambda} μ=λ1:表示事件发生的平均时间间隔。通常, μ \mu μ 值越大,事件发生的间隔时间越长。
概率密度函数(PDF)
f ( x ; λ ) = λ e − λ x for x ≥ 0 f(x; \lambda) = \lambda e^{-\lambda x} \quad \text{for} \quad x \ge 0 f(x;λ)=λe−λxforx≥0
累积分布函数(CDF)
F ( x ; λ ) = 1 − e − λ x for x ≥ 0 F(x; \lambda) = 1 - e^{-\lambda x} \quad \text{for} \quad x \ge 0 F(x;λ)=1−e−λxforx≥0
绘图
我们将绘制不同 (\lambda) 值下的指数分布的概率密度函数(PDF)和累积分布函数(CDF)。接下来,我们使用 Python 绘制这些图。
import numpy as np
import matplotlib.pyplot as plt# 定义参数
lambdas = [0.5, 1.0, 1.5] # 不同的lambda值
x = np.linspace(0, 10, 400) # x范围# 绘制PDF
plt.figure(figsize=(14, 6))# PDF
plt.subplot(1, 2, 1)
for lambd in lambdas:pdf = lambd * np.exp(-lambd * x)plt.plot(x, pdf, label=f'λ = {lambd}')
plt.title('Exponential Distribution - PDF')
plt.xlabel('x')
plt.ylabel('f(x)')
plt.legend()# CDF
plt.subplot(1, 2, 2)
for lambd in lambdas:cdf = 1 - np.exp(-lambd * x)plt.plot(x, cdf, label=f'λ = {lambd}')
plt.title('Exponential Distribution - CDF')
plt.xlabel('x')
plt.ylabel('F(x)')
plt.legend()plt.tight_layout()
plt.show()
以上代码将生成两个图,一个是概率密度函数(PDF),另一个是累积分布函数(CDF),每个图中都展示了不同 λ \lambda λ 值(0.5、1.0、1.5)下的分布情况。现在,我将生成这些图并展示给你。
以上的图像展示了不同速率参数 (\lambda) 下的指数分布的概率密度函数(PDF)和累积分布函数(CDF)。
图像解读
-
PDF 图像:
- λ = 0.5 \lambda = 0.5 λ=0.5: 曲线下降较慢,表示事件发生的速率较低,间隔时间较长。
- λ = 1.0 \lambda = 1.0 λ=1.0: 曲线下降适中,表示事件发生的速率为中等。
- λ = 1.5 \lambda = 1.5 λ=1.5: 曲线下降较快,表示事件发生的速率较高,间隔时间较短。
-
CDF 图像:
- λ = 0.5 \lambda = 0.5 λ=0.5: 曲线上升较慢,表示在较长的时间范围内事件才有较高的发生概率。
- λ = 1.0 \lambda = 1.0 λ=1.0: 曲线上升适中。
- λ = 1.5 \lambda = 1.5 λ=1.5: 曲线上升较快,表示在较短的时间范围内事件就有较高的发生概率。
通过这些图像,可以直观地理解不同速率参数 λ \lambda λ 对于指数分布的影响。
3.3 指数分布拟合
loc_expon, scale_expon = expon.fit(data)expon_pdf = expon.pdf(x, loc_expon, scale_expon)
这行代码 loc_expon, scale_expon = expon.fit(data)
是使用 Python 的 SciPy 库中的 expon
(指数分布)来拟合数据 data
。具体来说,它使用指数分布来估计数据的参数。
代码解读
-
expon.fit(data)
:- 这是 SciPy 库中
expon
对象的方法,用于拟合指数分布到数据data
。 data
是你要拟合的数据数组。
- 这是 SciPy 库中
-
返回值:
expon.fit(data)
返回两个参数:loc
和scale
,分别对应指数分布的定位参数和尺度参数。loc_expon
是定位参数(loc
)。scale_expon
是尺度参数(scale
)。
指数分布的参数
-
定位参数(
loc
):- 这是指数分布的平移参数,默认情况下为 0。它决定了分布的起点位置。
-
尺度参数(
scale
):- 这是指数分布的尺度参数,与速率参数 λ \lambda λ 有关。具体来说,尺度参数等于速率参数的倒数,即 scale = 1 λ \text{scale} = \frac{1}{\lambda} scale=λ1。
指数分布拟合
指数分布的概率密度函数(PDF)为:
f ( x ; λ ) = λ e − λ ( x − loc ) f(x; \lambda) = \lambda e^{-\lambda (x - \text{loc})} f(x;λ)=λe−λ(x−loc)
拟合数据时,我们实际上在估计参数 λ \lambda λ和 loc \text{loc} loc 以使得这个分布最符合数据 data
。
例子
假设我们有一组数据,并希望用指数分布来拟合它们,代码可能如下:
import numpy as np
from scipy.stats import expon# 生成一些示例数据
data = np.random.exponential(scale=2, size=1000)# 拟合指数分布到数据
loc_expon, scale_expon = expon.fit(data)print(f"loc: {loc_expon}, scale: {scale_expon}")
在这个例子中,我们生成了一些服从指数分布的数据,然后使用 expon.fit
方法来拟合这些数据并估计参数 loc
和 scale
。结果 loc_expon
和 scale_expon
将分别是定位参数和尺度参数。