在 Python 中,你可以使用 PyPDF2 库来拆分 PDF 文件。以下是一个简单的示例,演示如何将一个 PDF 文件拆分为多个单页 PDF 文件。
首先,你需要安装 PyPDF2 库。如果尚未安装,可以使用以下命令进行安装:
pip install PyPDF2
然后,可以使用以下代码来拆分 PDF 文件:
import PyPDF2def split_pdf(input_pdf_path, output_folder):# 打开输入的 PDF 文件with open(input_pdf_path, "rb") as input_pdf_file:# 创建一个 PdfFileReader 对象pdf_reader = PyPDF2.PdfFileReader(input_pdf_file)# 获取 PDF 文件的总页数num_pages = pdf_reader.numPages# 遍历每一页for page_number in range(num_pages):# 创建一个 PdfFileWriter 对象pdf_writer = PyPDF2.PdfFileWriter()# 将当前页添加到 PdfFileWriter 对象pdf_writer.addPage(pdf_reader.getPage(page_number))# 创建输出文件路径output_pdf_path = f"{output_folder}/page_{page_number + 1}.pdf"# 将当前页写入新的 PDF 文件with open(output_pdf_path, "wb") as output_pdf_file:pdf_writer.write(output_pdf_file)print(f"已保存: {output_pdf_path}")# 示例使用
input_pdf_path = "input.pdf" # 输入 PDF 文件的路径
output_folder = "output_pages" # 输出文件夹的路径
split_pdf(input_pdf_path, output_folder)
请确保将 input.pdf
和 output_pages
替换为实际的输入文件路径和输出文件夹路径。运行此代码后,PDF 文件将被拆分为多个单页 PDF 文件,并保存到指定的输出文件夹中。