Python自动化办公(一) —— 根据PDF文件批量创建Word文档
在日常办公中,我们经常需要根据现有的PDF文件批量创建Word文档。手动操作不仅费时费力,而且容易出错。幸运的是,使用Python可以轻松实现这个过程。本文将介绍如何使用Python脚本遍历一个文件夹中的PDF文件,并根据每个PDF文件的名字创建对应的Word空白文件。
安装所需的Python库
首先,我们需要安装python-docx
库来创建和操作Word文档。在终端或命令行中运行以下命令进行安装:
pip install python-docx
编写Python脚本
以下是一个完整的Python脚本,演示如何根据PDF文件名创建对应的Word空白文件:
import os
from docx import Documentdef create_word_from_pdf(pdf_folder, word_folder):# 检查保存Word文件的文件夹是否存在,如果不存在则创建if not os.path.exists(word_folder):os.makedirs(word_folder)# 遍历PDF文件夹中的所有文件for filename in os.listdir(pdf_folder):if filename.endswith(".pdf"):# 获取文件名(去掉扩展名)base_name = os.path.splitext(filename)[0]# 创建对应的Word文件名word_filename = base_name + ".docx"word_path = os.path.join(word_folder, word_filename)# 创建一个空白的Word文档doc = Document()# 保存Word文档doc.save(word_path)print(f"Created: {word_path}")# 设置PDF文件夹和保存Word文件的文件夹路径
pdf_folder = 'path/to/pdf_folder'
word_folder = 'path/to/word_folder'# 调用函数
create_word_from_pdf(pdf_folder, word_folder)
详细步骤解释
-
导入必要的模块:
os
: 用于文件和目录操作。Document
从python-docx
: 用于创建和操作Word文档。
-
定义函数
create_word_from_pdf
:pdf_folder
: 存储PDF文件的文件夹路径。word_folder
: 将创建的Word文件保存到这个文件夹路径。
-
检查和创建Word文件夹:
- 使用
os.makedirs
创建目标文件夹,如果它不存在的话。
- 使用
-
遍历PDF文件夹:
- 使用
os.listdir
列出文件夹中的所有文件,并过滤出以.pdf
结尾的文件。
- 使用
-
生成Word文件名:
- 使用
os.path.splitext
获取文件名(去掉扩展名),并生成对应的Word文件名。
- 使用
-
创建空白Word文档并保存:
- 使用
Document
创建一个空白的Word文档。 - 使用
doc.save
保存Word文档到指定路径。
- 使用
运行脚本
将上面的代码保存为一个Python脚本文件(例如 create_word_from_pdf.py
),然后在终端或命令行中运行:
python create_word_from_pdf.py
确保你已经设置了正确的 pdf_folder
和 word_folder
路径。例如:
pdf_folder = '/path/to/your/pdf_folder'
word_folder = '/path/to/your/word_folder'
通过这个脚本,你可以根据PDF文件名在指定文件夹中创建对应的Word空白文件。如果你有任何特定需求或问题,请在评论区告诉我!