data文件夹内,有多个xls文件。每个xls文件格式一致, 表头占两行,表位汇总数据占一行。
表头两行,拼接前第二行设置为表头,且删除第二行。
在python读入的dataframe中,成本表是表头,第一行是线路。在dataframe里面设置第0行(线路)为表头之后,删除第0行(线路)。
表尾一行,拼接前删除。
import pandas as pd
import os"连接文件夹内多个xls表格"
data_list = []path = "./"
data_dir = os.path.join(path, 'yy_data')
for filename in os.listdir(data_dir):name_dir = os.path.join(data_dir, filename)// print(filename.split(".")[-1])if filename.endswith((".xls","xlsx")):df = pd.read_excel(name_dir)df.drop([len(df) - 1], inplace=True) # 删除最后一行c_list = df.values.tolist()[0] # 得到想要设置为列索引【表头】的某一行提取出来df.columns = c_list # 设置列索引【表头】df.drop(index=[0], inplace=True) #删除设置为表头的 第一行data_list.append(df)# concat合并Pandas数据
data_all =pd.concat(data_list)
# 将 DataFrame 保存为 excel 文件
data_all.to_excel("总和.xlsx",index=False)# 查看 DataFrame 的行数和列数。
rows = data_all.shape
print("查看行数与列数:", rows)
print("恭喜你,合并完成!")
文件夹内 文件重命名
def rename(path):data_dir = os.path.join(path, 'data')# 创建文件夹xls_path = 'xls_data'if not os.path.exists(xls_path):os.makedirs(xls_path)for f in os.listdir(data_dir):name_dir = os.path.join(data_dir, f)if f.split(".")[-1] != 'xls':new_name = os.path.join(xls_path, f+ '.xls')# new_name = f + '.xls'shutil.copyfile(name_dir, new_name)print("重命名完毕")