在数据分析中,数据的分组与汇总是非常常见的操作。下面使用 Python 的 Pandas 库来处理表数据,并生成汇总结果。
导入数据
首先,我们需要导入必要的库并读取 Excel 文件中的数据:
import pandas as pd# 读取工资表数据
df = pd.read_excel('输入.xlsx')
假设我们的表数据如下所示:
姓名 | 基础1 | 基础2 | 其他 |
---|---|---|---|
张三 | 5000 | 2000 | 1000 |
李四 | 6000 | 2500 | 1200 |
王五 | 4500 | 2200 | 900 |
张三 | 5200 | 2100 | 1050 |
李四 | 6100 | 2600 | 1250 |
分组与汇总
接下来,我们将按照姓名进行分组,并对各类数据进行合计:
# 按照姓名分组并合计各类工资
df_grouped = df.groupby('姓名')[["基础1", "基础2", "其他"]].sum()
汇总后的数据如下:
姓名 | 基础1 | 基础2 | 其他 |
---|---|---|---|
张三 | 10200 | 4100 | 2050 |
李四 | 12100 | 5100 | 2450 |
王五 | 4500 | 2200 | 900 |
导出结果
最后将汇总后的数据导出到一个新的 Excel 文件中:
# 导出合并后的结果到新的 Excel 文件
df_grouped.to_excel('salary_summary.xlsx', index=True)
# index=True 会保留姓名列作为索引
print("结果已成功导出到 'salary_summary.xlsx'.")