案例 14: 数据透视表 - 使用 pivot_table
知识点讲解
数据透视表是一种常见的数据汇总工具,用于按照一个或多个键对数据进行分类汇总。Pandas 的 pivot_table
函数提供了一种快速创建数据透视表的方法。你可以指定行索引、列索引,以及用于聚合的数据和函数。
- 创建数据透视表:
pivot_table
允许你对 DataFrame 进行分组,并对每个分组应用聚合函数。这非常适用于多维度的数据分析。
示例代码
# 准备数据和示例代码的运行结果,用于案例 14# 示例数据
data_pivot_table = {'Date': ['2023-01-01', '2023-01-01', '2023-01-02', '2023-01-02'],'Product': ['Apple', 'Banana', 'Apple', 'Banana'],'Sales': [50, 60, 40, 80]
}
df_pivot_table = pd.DataFrame(data_pivot_table)# 创建数据透视表
pivot_table_result = df_pivot_table.pivot_table(values='Sales', index='Date', columns='Product', aggfunc='sum')pivot_table_result
在这个示例中,我们创建了一个包含日期、产品和销售额的 DataFrame,并使用 pivot_table
函数创建了一个数据透视表,它按日期(行)和产品(列)对销售额进行了汇总。
示例代码运行结果
Product Apple Banana
Date
2023-01-01 50 60
2023-01-02 40 80
这个数据透视表展示了不同日期下,不同产品的销售总额。数据透视表是分析和报告数据的强大工具,特别是在处理分类数据和时间序列数据时。