1.环境准备
- 安装好python并且配置好环境
- 安装pdfplumber、xlwt库
- 使用Vscode或者PyCharm等编辑器
在pycharm中如果报红,可以鼠标点击报红的库,alt+enter进行安装
2.代码部分
import pdfplumber
import xlwt
# 读取源pdf文件
pdf = pdfplumber.open("./test.pdf")
# 创建excel
workboot = xlwt.Workbook()
# 创建sheet
sheet = workboot.add_sheet("Sheet1")
# 行计数
i = 0
# 循环读取pdf的每一页
for page in pdf.pages:# 读取表格for table in page.extract_tables():# 读取表格中的行for row in table:print(row)for j in range(len(row)):sheet.write(i, j, row[j])i += 1
pdf.close()
print(i)
workboot.save(".test.xlsx")
最后把要转换的pdf文件名写到对应的地方,给xlsx文件命好名字,运行就可以得到对应的excel表了。