利用 openpyxl 模块,操作Excel,比较Excel两列数据,并分别显示差异
表格数据样例如下图
A,B两列是需要进行比较的数据(数据源为某网站公开数据);C,D两列是比较结果的输出列
A,B两列数据大都是通过半角逗号分割的人名,且排序为乱序,最后需要得到 C列:A有B无,D列:A无B有 两列数据
试过用 Beyond Compare,但效果一般;方方格子还有其他的倒是没试过
Python 源码如下
#-*- coding: utf-8 -*-import openpyxldef compare(path):# openpyxl 加载指定表格(操作时,表格需要为关闭状态)wb = openpyxl.load_workbook(path)# 指定需要操作的 表格页面ws = wb['Sheet']# A列数据col_a = []# B列数据col_b = []col_c = []col_d = []# 没有对A,B列中空数据进行特殊处理,如有需要,自行修改# 将A列数据拼接为listfor col in list(ws.columns)[0]:col_a.append(str(col.value))# 将B列数据拼接为listfor col in list(ws.columns)[1]:col_b.append(str(col.value))for i in range (0, len(col_a)):# A有B无s_a = ''# A无B有s_b = ''# 根据指定分隔符对表格内容进行分隔,如有多种分隔符,需要替换成同一种col_c = col_a[i].split(",")col_d = col_b[i].split(",")# 第三列数据为 A有B无for m in range(0, len(col_c)):if col_b[i].find(col_c[m]) == -1:s_a = s_a + col_c[m] + ','ws.cell(i+1, 3).value = s_a #末尾会加上 , 不需要的话,改成 ws.cell(i+1, 3).value = s_a[:-1]# 第四列数据为 A无B有for n in range(0, len(col_d)):if col_a[i].find(col_d[n]) == -1:s_b = s_b + col_d[n] + ','ws.cell(i+1, 4).value = s_b #末尾会加上 , 不需要的话,改成 ws.cell(i+1, 4).value = s_b[:-1]# 保存上述操作,不写这句,表格内容不会保存wb.save(path)def main():# 指定表格路径excel_path = r'.\测试数据.xlsx'compare(excel_path)if __name__ == '__main__':main()