使用python将PDF转word

实现功能,将程序所在当前路径下的所有PDF文件转化为word

import os
from pdf2docx import Converter# 获取当前路径
current_path = os.getcwd()# 遍历当前路径下的所有文件和文件夹
for file_name in os.listdir(current_path):# 检查文件是否为 PDF 文件if file_name.endswith(".pdf"):# 构建输入和输出文件路径pdf_file_path = os.path.join(current_path, file_name)docx_file_path = os.path.join(current_path, os.path.splitext(file_name)[0] + ".docx")# 创建 Converter 对象并将 PDF 转换为 DOCXcv = Converter(pdf_file_path)cv.convert(docx_file_path, start=0, end=None)cv.close()print(f"已将 {file_name} 转换为 {os.path.basename(docx_file_path)}")

上述代码中使用了 os 模块来获取当前路径及构建文件路径,使用了 pdf2docx 模块来进行 PDF 到 DOCX 的转换。通过遍历当前路径下的所有文件和文件夹,并判断是否是 PDF 文件,将其转换为 DOCX 文件。

可以使用以下命令进行安装pdf2docx 模块:

pip install pdf2docx

运行上述代码后,将会在当前路径下生成与每个 PDF 文件对应的 DOCX 文件。

 

可执行程序(可直接运行)可从资源中直接下载使用

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/11247.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

[SQL挖掘机] - 全连接: full join

介绍: 在sql中,join是将多个表中的数据按照一定条件进行关联的操作。全连接(full join)是一种连接类型,它会返回所有满足连接条件的行,同时还包括那些在左表和右表中没有匹配行的数据。 在进行全连接时,会…

Kotlin Multiplatform 使用测试单元

编写常见的测试代码 现在您有了一个基于字符串的 API,可以通过它进行基本的测试。 1、在公共的测试模块中创建一个 org.jetbrains.base64 包 2、在新包下面创建 Base64Test.kt文件 3、在文件中添加代码 package org.jetbrains.base64import com.example.myapplicat…

医学案例|配对wilcoxon符号秩检验

一、案例介绍 某单位想要研究某保健品对小鼠是否具有抗疲劳作用,将同种属的小鼠按性别与年龄相同、体重相近配成对子,共14对,并将每对中的两只小鼠随机分配到两个不同的保健食品剂量组,测量小鼠负重5%体重时的游泳时间…

git 合并非关联分支

面对的场景:现在有三个仓库,一个是本地的仓库1,第二个是和仓库1关联的在github上的仓库2,第三个是把仓库1拷贝到一个无网络环境中持续开发一段时间的仓库3. 分析 基本想法是把仓库3作为仓库1的远程仓库,然后在仓库1上…

uiautomatorViewer无法获取Android8.0手机屏幕截图的解决方案

问题描述: 做APP UI自动化的时候,会碰到用uiautomatorViewer在Android 8.0及以上版本的手机上,无法获取到手机屏幕截图,无法获取元素定位信息的问题,会有以下的报 在低版本的Android手机上,则没有这个问题…

Istio网关Gateway 启用TLS

Istio网关Gateway概述 Istio网关Gateway是一个负责处理南北向流量的组件,它通常会暴露服务网格内部的服务,以便外部的请求能够访问到服务网格中的服务。Istio网关Gateway支持多种协议,包括HTTP、HTTPS和GRPC等。 在Istio网关Gateway中&#…

二、Java框架基础02 XML

二、XML 2.1 XML 简介 XML 即可扩展标记语言,一种简单的数据存储语言,使用一系列简单的标记来描述结构化数据 XML 的特点 XML 与操作系统,编程语言的开发平台无关规范统一,实现不同系统之间的数据交互 2.1.1 XML 的文档结构 以下…

防火墙的ALG、NAT、双机热备知识点详解

具体的NAT和双机热备实验请到:NAT与双机热备实验 目录 1、ALG 2、NAT ALG 3、NAT域间双向转换 4、NAT域内双向转换 5、双出口NAT 6、防火墙的双机热备 解决方案1:VGMP 6.1 双机热备份技术产生的背景: 6.2 VRRP在多区域防火墙组网中的…

吐血整理,性能测试最重要指标分析说明,一步通关...

目录:导读 前言一、Python编程入门到精通二、接口自动化项目实战三、Web自动化项目实战四、App自动化项目实战五、一线大厂简历六、测试开发DevOps体系七、常用自动化测试工具八、JMeter性能测试九、总结(尾部小惊喜) 前言 QPS Queries Per …

swiper不生效/切换不生效,点击切换按钮activeIndex值不对应问题@令狐张豪

原因:因为把new Swiper放在mounted实例化的时候可能v-for并未执行完成结构还未完全生成 错误:先执行了swiper实例化后循环的;正确:先循环完数据确保数据完整循环完成后再执行swiper实例化; 解决方案:watch…

SketchUp 如何选择合适的硬件配置?

SketchUp 本地配置不足可以尝试云端解决方案: 渲云渲染插件 渲云云渲染面向多领域三维内容制作提供云渲染服务,帮助用户快速完成三维内容、动画及效果图的渲染计算,规避因本地电脑配置不足导致渲染慢的问题,大幅提高工作效率&…

注解和反射03--Class对象

注解和反射 Class类Class类的常用方法获取Class类的实例哪些类型可以有Class对象 Class类 在Object类重定义了以下的方法,此方法将被所有子类继承 public final Class getClass()以上的方法返回值的类型是一个Class类,此类是Java反射的源头&#xff0c…

一百三十七、Hive——HQL运行报错(持续更新中)

一、timestamp字段与int字段相加 (一)场景 change_time字段是timestamp字段,代表一个红绿灯周期的开始时间(先是绿灯、再是黄灯、最后红灯),而green是int字段,代表绿灯的秒数,现在…

EPPlus与Microsoft.Office.Interop.Excel的使用区别

文章目录 代码的使用区别EPPlus的工作原理Microsoft.Office.Interop.Excel的使用原理代码的使用区别 static void ExportToExcel(List<(string, double, double)> list, string outputFilePath){//Microsoft.Office.Interop.Excel的使用 /* Excel.Application excelAp…

Docker 阿里云容器镜像服务

阿里云-容器镜像服务ACR 将本地/服务器docker image&#xff08;镜像&#xff09;推送到 阿里云容器镜像服务仓库 1. 在容器镜像服务ACR中创建个人实例 2. 进入个人实例 > 命名空间 创建命名空间 3. 进入个人实例 > 镜像仓库 创建镜像仓库 4. 进入镜像仓库 > 基本信…

论文笔记--Distilling the Knowledge in a Neural Network

论文笔记--Distilling the Knowledge in a Neural Network 1. 文章简介2. 文章概括3 文章重点技术3.1 Soft Target3.2 蒸馏Distillation 4. 文章亮点5. 原文传送门 1. 文章简介 标题&#xff1a;Distilling the Knowledge in a Neural Network作者&#xff1a;Hinton, Geoffre…

【iOS】isKindOfClass和isMemberOfClass方法

前言 这个归根结底还是在考察我们对isa走向图和类的继承的理解&#xff0c;也就是苹果官方这幅图&#xff1a; 接下来的函数调用流程请参考这张图。 1 isKindOfClass方法 1.1 objc_opt_isKindOfClass C函数 查看源码可发现&#xff0c;无论是谁调用isKindOfClass方法都会…

flex布局进阶

推荐看一下阮一峰老师的flex布局博客【Flex 布局教程&#xff1a;语法篇】(https://www.ruanyifeng.com/blog/2015/07/flex-grammar.html#)&#xff0c;讲的非常清晰。 一、多行布局大小相同的子盒子技巧 使用弹性布局实现多行均匀布局时&#xff0c;如若子盒子数量不能被每行…

工具推荐:文件同步工具 Rsync

文章首发地址 Rsync是一款常用的文件同步工具&#xff0c;适用于Unix/Linux/Windows等多多种操作系统&#xff0c;具有快速、高效、可靠、安全等特点。Rsync使用基于rsync协议的算法&#xff0c;在同步文件时只传输文件的差异部分&#xff0c;因此可以大大加快文件同步的速度。…

Java多进程(详细)

进程的含义 简单理解是正在跑起来的程序&#xff0c;正在运行的程序。没有正在运行的程序不叫进程&#xff0c;同一个程序&#xff0c;运行多次&#xff0c;就可能产生多个进程。 平时所说的程序&#xff0c;值的是一些exe的可执行文件&#xff0c;得把程序跑起来才会涉及到进程…