python使用PyPDF2包:pdf转doc

需要安装 python-docx 和 PyPDF2

pip install python-docx
pip install PyPDF2

记住,不能直接安装 pip install docx ,不然会报错 ImportError: No module named ‘exceptions’

import PyPDF2
from docx import Documentdef convert_pdf_to_doc(pdf_path, doc_path):with open(pdf_path, 'rb') as pdf_file:pdf_reader = PyPDF2.PdfReader(pdf_file)doc = Document()nums = len(pdf_reader.pages)print("total page:", nums)for page_num in range(nums):page = pdf_reader.pages[page_num]text = page.extract_text()doc.add_paragraph(text)print("current page:", page_num)doc.save(doc_path)# 使用示例
pdf_path = 'in.pdf'  # 输入的PDF文件路径
doc_path = 'out.docx'  # 输出的DOC文件路径
convert_pdf_to_doc(pdf_path, doc_path)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/87511.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

PHP8的类与对象的基本操作之类常量-PHP8知识详解

php 8引入了一种新的特性,称为类常量(class Constants)。类常量是在类中定义的常量,类似于全局常量,但作用域仅限于定义它们的类。 在PHP 8中,类常量的作用域被限制在定义它们的类中。这意味着只有类的成员…

【算法思想-排序】根据另一个数组次序排序 - 力扣 1122 题

💝💝💝欢迎来到我的博客,很高兴能够在这里和您见面!希望您在这里可以感受到一份轻松愉快的氛围,不仅可以获得有趣的内容和知识,也可以畅所欲言、分享您的想法和见解。 推荐:kuan 的首页,持续学…

学习记忆——宫殿篇——记忆宫殿——记忆桩——学校

教室 桶 走道 桌子 暖气 窗台 后背 窗帘 监视器 白盒子 教师 讲台 表 投影仪 音响 窗 喇叭 黑板 门 栏杆 椅子 食堂 桶 刷卡器 柱子 桌子 风扇 灯罩 一列椅子 地面 大门空间 电视 活动室 盘子 纸盒 油桶 称 水桶 展牌 帘子 消防栓 毯子 储物箱 宿舍 梯子 坐垫 挂件 吊兰 君子…

TypeScript入门教程:从安装到使用

介绍 TypeScript是一种开源的编程语言,它是 JavaScript 的一个超集,为 JavaScript 添加了静态类型检查和其他高级特性,使得编写大型、复杂项目变得更加容易和可维护。通过在开发过程中捕获潜在的错误和提供更好的工具支持, TypeS…

大学宿舍IP一键视频对讲

大学宿舍ip一键视频对讲 大学宿舍一键视频对讲是指在大学宿舍内安装一套视频对讲系统,通过一键操作,实现与宿舍内其他人进行视频通话的功能。 该系统通常包括以下组成部分: 1. 室内终端:每个宿舍内安装一个室内终端,…

前端性能测试工具-lighthouse

Lighthouse简介 Lighthouse 是 Google 的一款开源工具,它可以作为一个 Chrome 扩展程序运行,或从命令行运行。只需要给 Lighthouse 提供一个要审查的网址,它将针对此页面运行一连串的测试,然后生成一个页面性能的报告。 Lightho…

C++ - map 和 set 的模拟实现 - 红黑树当中的仿函数 - 红黑树的迭代器实现

简单了解map 和 set 的实现 首先我们要知道,map 和 set 的底层就是 红黑树,但是 STL 当中 ,map 和 set 并不是我们想象的,直接使用一个 pair 对象来存储一个 key-value 或者 是 一个 key。具体如下所示: set&#xff…

华纳云:SQLserver配置远程连接的方法是什么

在 SQL Server 中配置远程连接涉及一些步骤,包括启用远程连接、配置网络协议、设置防火墙规则和授权远程访问。以下是一些配置远程连接的主要步骤: 启用远程连接: 打开 SQL Server Management Studio(SSMS)并连接到你的…

Linux qemu启动内核rootfs挂载失败VFS: Cannot open root device问题解决方案

rootfs挂载失败 But using this QEMU emulation setup I tried to produce minimal examples of every possible failure type to help you debug your problem. In that simple setup, QEMU emulates a system with: a single virtio disk which represents a hard disk or …

QUIC协议报文解析(三)

在前面的两篇文字里我们简单介绍了QUIC的发展历史,优点以及QUIC协议的连接原理。本篇文章将会以具体的QUIC报文为例,详细介绍QUIC报文的结构以及各个字段的含义。 早期QUIC版本众多,主要有谷歌家的gQUIC,以及IETF致力于将QUIC标准…

Spring底层原理之 BeanFactory 与 ApplicationContext

🐌个人主页: 🐌 叶落闲庭 💨我的专栏:💨 c语言 数据结构 javaEE 操作系统 Redis 石可破也,而不可夺坚;丹可磨也,而不可夺赤。 Spring底层原理 一、 BeanFactory 与 Appli…

二维码智慧门牌管理系统:提升城市管理效率与服务水平

文章目录 前言一、系统原理及特点二、系统的优势与应用 前言 在当今快速发展的信息化时代,如何有效地管理城市地址信息成为了各大城市面临的重要问题。传统的门牌管理系统已经无法满足现代城市的需求,而二维码智慧门牌管理系统作为全新的解决方案&#…

ref和reactive区别

使用区别 reactive定义引用数据类型,ref 定义基本类型 reactive定义的变量直接使用,ref 定义的变量使用时需要.value 模板中均可直接使用,vue帮我们判断了是reactive还是ref定义的(通过__v_isRef属性),从而自动添加了.value。 /…

ruoyi-vue项目的打包、与运行

ruoyi-vue项目的打包、与运行 打包打包后文件,及其运行 打包 打包后文件,及其运行 注意:要(带配置)打开redis redis-server.exe redis.windows.conf

逆向-beginners之C++ 线程本地存储TLS

#include <iostream> #include <thread> /* * 线程本地存储(Thread Local Storage, TLS)是一种在线程内部共享数据的数据交换区域。 * * 每个线程都可以在这个区域保存它们要在内部共享的数据。 * * 一个比较知名的例子是C语言的全局变量errno。对于errno这类…

《计算机网络》——应用层

2.1 应用层协议原理&#xff08;P54&#xff09; 研发网络应用的核心是写出能够运行在不同端系统和通过网络彼此交流的程序。 2.1.1 网络应用程序体系结构 两种主流的应用体系结构&#xff1a;客户-服务器体系结构、对等体系结构。 客户-服务器体系&#xff1a;服务器是一个…

最新《2023上半年网络安全观察报告》发布,解读网络安全发展

回顾2023上半年&#xff0c;人工智能大模型飞速应用于网络攻击与对抗&#xff0c;颠覆传统攻防场景&#xff0c;新型安全威胁凸显&#xff1b;国产化系统漏洞被大规模利用&#xff0c;严重威胁国内用户数据安全与财产安全&#xff1b;个人信息泄露问题频频出现&#xff0c;数据…

MySQL报错:json_contains: “The document is empty.“ at position 0.

起因 在使用json_contains查询MySQL表里面的JSON字段数据时&#xff0c;报错&#xff1a;3141 Invalid JSON text in argument 1 to function json_contains: "The document is empty." at position 0. 经过 通过排查发现&#xff0c;是因为所查JSON字段json_field…

机器学习——SVM(支持向量机)

0、前言&#xff1a; SVM应用&#xff1a;主要针对小样本数据进行学习、分类和回归&#xff08;预测&#xff09;&#xff0c;能解决神经网络不能解决的过学习问题&#xff0c;有很好的泛化能力。&#xff08;注意&#xff1a;SVM算法的数学原理涉及知识点比较多&#xff0c;所…

【ELFK】之消息队列kafka

一、kafka的定义 Kafka 是一个分布式的基于发布/订阅模式的消息队列&#xff08;MQ&#xff0c;Message Queue&#xff09;&#xff0c;主要应用于大数据实时处理领域。Kafka 是最初由 Linkedin 公司开发&#xff0c;是一个分布式、支持分区的&#xff08;partition&#xff0…