有两张不同大小的excel表
表1:字典的选项值,2118行
表2:字典名称,405行
表1和表2有共同的列.
现在需要根据共同的列,以表1为底,将表2的值对应添加到表1的每一行。
下面是代码:
1.加载相关的库
import numpy as np
import pandas as pd
from pandas import Series,DataFrame
2.导入两张表
path_key = 'E:dict_key.xlsx'
path_value = 'E:dict_value.xlsx'
key = pd.read_excel(path_key)
value = pd.read_excel(path_value)
3.看下两张表的导入效果
4.使用merge函数将两张表合并
all = pd.merge(value, key, on='KEY_NAME', how='left', sort=False)
#on为共同的列名
#how为左连接,左边取全部,右边取部分,没有值则用NaN填充
#sort=False为不需要排序
index = ['KEY_NAME', 'KEY_CHN_NAME', 'OPT_NAME', 'OPT_CODE']
#合并后的数据只取需要的几列,index为列索引
all.loc[:, index]
看一下效果:
5.导出合并后的文件
all.loc[:, index].to_excel('E:dict_all.xlsx', encoding='gbk' )
encoding设置一下,防止乱码。