案例 40: 分组并应用多个聚合函数
知识点讲解
Pandas 的 groupby
和 agg
方法使得对数据分组后应用多个聚合函数成为可能。这在数据分析中非常有用,可以快速得到分组统计数据。
- 分组聚合: 使用
groupby
方法对数据进行分组。 - 多重聚合: 使用
agg
方法并传递一个包含多个聚合函数的列表,可以对每个组应用多个聚合操作。
示例代码
# 准备数据和示例代码的运行结果,用于案例 40# 示例数据
data_aggregation = {'Group': ['A', 'A', 'B', 'B', 'C', 'C'],'Values': [10, 15, 20, 25, 30, 35]
}
df_aggregation = pd.DataFrame(data_aggregation)# 分组并应用多个聚合函数
aggregated_data = df_aggregation.groupby('Group').agg(['sum', 'mean', 'max'])df_aggregation, aggregated_data
在这个示例中,我们根据 Group
列对数据进行分组,并对每个组应用了求和 (sum
)、平均 (mean
) 和最大值 (max
) 三个聚合函数。
示例代码运行结果
原始 DataFrame (df_aggregation
):
Group Values
0 A 10
1 A 15
2 B 20
3 B 25
4 C 30
5 C 35
分组并聚合后的结果 (aggregated_data
):
Values sum mean max
Group
A 25 12.5 15
B 45 22.5 25
C 65 32.5 35
这个结果显示了每个组的总和、平均值和最大值。通过这种方式,可以快速对数据进行多维度的分析。