工作中我们常常遇到多个格式相同的表格面要合并成一个表格,比如将2019年的数据与2020年的数据合并在一起来进行分析。平时EXCEL时我们通常直接复制粘贴,但有时因表格内容过大,直接粘贴效率低,且当字段过多时还需要进行逐列粘取我们所需要的字段,易错率高,这时我们就可以用python轻松提取我们需要的共同字段并合并表格。
import pandas as pd
#读取2019和2020年的数据
df=pd.read_excel(r"D:work需求计划采购记录2019.xlsx")
df2020=pd.read_excel(r"D:work需求计划采购记录2020.xlsx")
#分别提取需要的字段名
df2019=df[["定单 日期","第二项目 号","行说明","规格型号1","制造商名称","供应商 名","原始定单数量","单位 成本","原始定购 金额","承诺 交货日期","实际发运 日期","定单号","项目号"]]
df2020=df2020[["定单 日期","第二项目 号","行说明","规格型号1","制造商名称","供应商 名","原始定单数量","单位 成本","原始定购 金额","承诺 交货日期","实际发运 日期","定单号","项目号"]]
#合并2019和2020,ignore_index=True表示索引重置,drop_duplicates()表示去重
df=pd.concat([df2019,df2020],ignore_index=True).drop_duplicates()
#取单位成本大于10000的数据
df1=df[df["单位 成本"]>10000]
#输出表格
df1.to_excel(excel_writer=r"D:work需求计划采购记录20192020大金额采购清单1.xlsx")
df.to_excel(excel_writer=r"D:work需求计划采购记录20192020合并表.xlsx")