案例 7: 数据分组与聚合 - 使用 groupby
进行分析
知识点讲解
数据分组和聚合是数据分析中的强大工具,它们使我们能够按照某个或某些特定的列将数据分组,并对每个分组应用聚合函数,以便进行分析。
示例代码
基本分组与聚合
# 按照某列分组并计算每组的平均值
grouped_avg = df.groupby('Column').mean()
print(grouped_avg)
多列分组
# 按照多列分组
grouped_multiple = df.groupby(['Column1', 'Column2']).sum()
print(grouped_multiple)
分组后应用多个聚合函数
# 对分组数据应用多个聚合函数
grouped_multiple_agg = df.groupby('Column').agg(['mean', 'sum', 'count'])
print(grouped_multiple_agg)
使用 transform
方法
# 对分组后的数据应用 transform 方法
grouped_transform = df.groupby('Column')['AnotherColumn'].transform('mean')
df['GroupedMean'] = grouped_transform
print(df.head())
代码解释:
groupby('Column')
根据指定列进行分组。- 可以使用各种聚合函数,如
mean()
,sum()
,count()
等。 agg
方法允许对分组后的数据应用多个聚合函数。transform
方法可以对分组后的数据应用一个函数,并保持原始数据的形状。
通过分组和聚合,可以更深入地理解数据的内在结构和特征。