Python Tablib是麻省理工学院授权的与格式无关的表格数据集库。支持导入、导出和操作表格数据集,轻松的将数据导出为各种不同的格式,包括excel,json,html,yaml,csv,tsv等格式。接下来,
接下里,我们介绍下如何使用Tablib 实现指定目录的表格文件遍历操作。
代码整体设计比较简单,大致分为如下两步:
- 获取指定目录下特定文件前缀的全部execl 文件。
- 遍历每个文件,进行读写处理,并且写入到新的文件中。
获取文件
使用glob模块和os模块,实现获取指定目录下以dataset为前缀的全部execl文件。
执行如上代码,输出结果为:
使用Tablib进行表格操作
演示数据集dataset.xlsx如下:
加载dataset.xlsx文件 ,代码如下:
输出文件数据如下:
读写execl文件数据操作,代码如下:
如上代码输出结果如下:
遍历全部文件进行读写操作
使用如上获取文件get_all_file 函数与表格文件读写操作form_processing 函数,通过for遍历全部文件,实现每个文件的读写操作,如下: