用到的库:PyPDF2
实现效果:打开pdf文件,把每一页的内容读出来
代码:
import PyPDF2
# 打开pdf文件
file=open('friday.pdf','rb')
# 创建pdf文件阅读器对象
reader=PyPDF2.PdfReader(file)
# 获取pdf文件的总页数
total_pages=len(reader.pages)
print(total_pages)
# 遍历pdf的每一页,读取内容
for page_num in range(total_pages):page=reader.pages[page_num]page_text=page.extract_text()print(f'第{page_num+1}页')print(page_text)print('\n') # 换行
# 关闭文件
file.close()
运行结果: