案例 15: 移动平均 - 使用 rolling
方法
知识点讲解
移动平均是时间序列数据分析中的一种基本技术,用于平滑时间序列中的短期波动并突出长期趋势。Pandas 的 rolling
方法提供了计算移动平均的简便方式。
- 计算移动平均: 使用
rolling
方法,你可以指定窗口大小来计算移动平均。窗口大小决定了用于计算平均的连续观测值的数量。
示例代码
# 准备数据和示例代码的运行结果,用于案例 15# 示例数据
data_moving_average = {'Date': pd.date_range(start='1/1/2023', periods=5, freq='D'),'Sales': [200, 220, 250, 275, 300]
}
df_moving_average = pd.DataFrame(data_moving_average)# 计算移动平均
df_moving_average['MovingAverage'] = df_moving_average['Sales'].rolling(window=3).mean()df_moving_average
在这个示例中,我们有一个包含日期和销售额的 DataFrame。我们使用 rolling
方法和一个窗口大小为 3 的移动平均来平滑销售数据。
示例代码运行结果
Date Sales MovingAverage
0 2023-01-01 200 NaN
1 2023-01-02 220 NaN
2 2023-01-03 250 223.333333
3 2023-01-04 275 248.333333
4 2023-01-05 300 275.000000
这个结果展示了每天的销售额和对应的移动平均值。前两天的移动平均是 NaN
,因为窗口大小为 3,需要至少三个数据点来计算移动平均。
移动平均是理解和分析时间序列数据趋势的有力工具。