Python自动化办公:PDF文件的分割与合并

我们平时办公中,可能需要对pdf进行合并或者分割,但奈何没有可以白嫖的工具,此时python就是一个万能工具库。

其中PyPDF2是一个用于处理PDF文件的Python库,它提供了分割和合并PDF文件的功能。

在本篇博客中,我们将详细介绍如何使用PyPDF2库对PDF文件进行分割和合并,并通过案例进行演示。

1. 安装PyPDF2库

首先,确保你已经安装了PyPDF2库。如果没有安装,可以使用以下命令进行安装:

pip install PyPDF2

2. 分割PDF文件

案例演示:将一个PDF文件分割成多个文件


import PyPDF2def split_pdf(input_pdf, output_prefix):# 打开PDF文件with open(input_pdf, 'rb') as file:# 创建PDF阅读器对象pdf_reader = PyPDF2.PdfReader(file)# 遍历每一页for page_num in range(len(pdf_reader.pages)):# 创建新的PDF写入对象pdf_writer = PyPDF2.PdfWriter()# 添加当前页到新的PDF对象中pdf_writer.add_page(pdf_reader.pages[page_num])# 构建输出文件名output_file = f"{output_prefix}_page_{page_num + 1}.pdf"# 写入新的PDF文件with open(output_file, 'wb') as output:pdf_writer.write(output)# 使用示例
split_pdf('input.pdf', 'output_split')

在这个示例中,我们定义了一个split_pdf函数,该函数接受一个输入PDF文件和输出文件的前缀,并将输入的PDF文件分割成多个文件,每个文件包含一页。你可以根据需要修改输入文件和输出前缀。

可以看到运行代码后,会生成分割后的pdf文件

在这里插入图片描述

3. 合并PDF文件

案例演示:将多个PDF文件合并成一个文件

在这里插入图片描述

import PyPDF2def merge_pdfs(input_pdfs, output_pdf):# 创建PDF写入对象pdf_writer = PyPDF2.PdfWriter()# 遍历每个输入PDF文件for input_pdf in input_pdfs:# 打开当前输入PDF文件with open(input_pdf, 'rb') as file:# 创建PDF阅读器对象pdf_reader = PyPDF2.PdfReader(file)# 遍历每一页并添加到写入对象中for page_num in range(len(pdf_reader.pages)):pdf_writer.add_page(pdf_reader.pages[page_num])# 写入合并后的PDF文件with open(output_pdf, 'wb') as output:pdf_writer.write(output)# 使用示例
merge_pdfs(['input1.pdf', 'input2.pdf', 'input3.pdf', 'input4.pdf', 'input5.pdf'], 'output_merge.pdf')

在这个示例中,我们定义了一个merge_pdfs函数,该函数接受多个输入PDF文件和一个输出PDF文件,并将输入的多个PDF文件合并成一个文件。你可以根据需要修改输入文件和输出文件。

在这里插入图片描述
通过这些示例,你可以了解如何使用PyPDF2库对PDF文件进行分割和合并。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/177479.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

服务器数据恢复—服务器重装系统导致逻辑卷发生改变的数据恢复案例

服务器数据恢复环境: 某品牌linux操作系统服务器,服务器中有4块SAS接口硬盘组建一组raid5阵列。服务器中存放的数据有数据库、办公文档、代码文件等。 服务器故障&检测: 服务器在运行过程中突然瘫痪,管理员对服务器进行了重装…

MySQL的Linux安装

在MySQL官网下载压缩包MySQL :: Download MySQL Community Server (Archived Versions) 下载完成后将压缩包上传到Linux中。我这里是下的CentOS的压缩包。 并且用的是FinalShell连接工具,可以选择压缩包直接上传。 ​ 上传完毕后,新建mysql文件夹&…

vue3中readonly和shallowReadonly

readonly: 深度只读数据 获取一个对象 (响应式或纯对象) 或 ref 并返回原始代理的只读代理。 只读代理是深层的:访问的任何嵌套 property 也是只读的。 shallowReadonly 浅只读数据 创建一个代理,使其自身的 property 为只读,但不执行…

在线陪诊系统: 医学科技的革新之路

医疗服务的数字化时代已经到来,而在线陪诊系统正是医学科技革新的杰出代表。通过巧妙的技术代码,这一系统不仅实现了患者和医生之间的远程互动,还将医疗服务推向了一个更加智能化的未来。在这篇文章中,我们将深入探讨在线陪诊系统…

办公软件定制开发在企业发展中的优势|app小程序搭建

办公软件定制开发在企业发展中的优势|app小程序搭建 如今,办公软件已经成为企业日常工作的必需品。很多企业为了提高工作效率和满足自身业务需要,选择定制开发办公软件。下面将介绍定制开发办公软件在企业发展中的优势。 1定制开发办公软件可以满足企业…

9.4 Windows驱动开发:内核PE结构VA与FOA转换

本章将继续探索内核中解析PE文件的相关内容,PE文件中FOA与VA,RVA之间的转换也是很重要的,所谓的FOA是文件中的地址,VA则是内存装入后的虚拟地址,RVA是内存基址与当前地址的相对偏移,本章还是需要用到《内核解析PE结构导…

短视频账号矩阵系统开发--saas源头技术开发(手机版)

目前PC端网页版基本上已经很倦市场了,所以在这种情况下 ,我们已经专注开发短视频矩阵系统pc版3年了,目前我们这边核心技术优势就是都是自己一手搭建开发的并且我们的剪辑算法也是自己一手源头开发的,剪辑成本后期运营成本低&#…

万宾科技第四代可燃气体监测仪的作用

燃气作为一种重要的能源已在居民生活、工业生产和商业活动等领域得到了广泛的应用。但是与之而来的便是各种各样的燃气管网的安全问题,其中燃气管网泄漏成为了城市生命线建设中亟待解决的安全隐患。因此采取切实有效的措施来保障燃气管网的安全运行,应用…

docker容器入门

docker容器入门 1.1 容器介绍 容器技术是一种操作系统级的虚拟化技术,它允许在一个物理或虚拟机上运行多个隔离的应用程序实例,每个实例都被封装在一个独立的容器中。每个容器都包含应用程序及其依赖的运行时环境,如操作系统、库文件和配置…

leetcode:2864. 最大二进制奇数(python3解法)

难度:简单 给你一个 二进制 字符串 s ,其中至少包含一个 1 。 你必须按某种方式 重新排列 字符串中的位,使得到的二进制数字是可以由该组合生成的 最大二进制奇数 。 以字符串形式,表示并返回可以由给定组合生成的最大二进制奇数。…

Linux(9):正规表示法与文件格式化处理

简单的说,正规表示法就是处理字符串的方法,他是以行为单位来进行字符串的处理行为,正规表示法透过一些特殊符号的辅助,可以让使用者轻易的达到【搜寻/删除/取代】某特定字符串的处理程序。 正规表示法基本上是一种【表示法】&…

Linux驱动开发笔记(五):驱动连接用户层与内核层的文件操作集原理和Demo

若该文为原创文章,转载请注明原文出处 本文章博客地址:https://hpzwl.blog.csdn.net/article/details/134561660 红胖子网络科技博文大全:开发技术集合(包含Qt实用技术、树莓派、三维、OpenCV、OpenGL、ffmpeg、OSG、单片机、软硬…

TS版LangChain实战:基于文档的增强检索(RAG) | 京东云技术团队

LangChain LangChain是一个以 LLM (大语言模型)模型为核心的开发框架,LangChain的主要特性: 可以连接多种数据源,比如网页链接、本地PDF文件、向量数据库等允许语言模型与其环境交互封装了Model I/O(输入…

UE4/UE5 雾

雾 UE4/UE5 雾平面雾材质效果图: 3D雾区材质效果图: UE4/UE5 雾 平面雾 做好将材质放在Plane上就行 材质 效果图: 3D雾区 做好将材质放在3D模型上就行 材质 效果图:

羊大师:蜂蜜加羊奶,养颜美容佳品

羊大师:蜂蜜加羊奶,养颜美容佳品 蜂蜜和羊奶是两种自然界中的宝贵养生食材,它们的结合不仅味道美味,还具有丰富的营养价值和一系列的保健功效,被誉为养颜美容的佳品。下面让小编羊大师带大家来详细了解一下蜂蜜加羊奶…

美团小游戏rpk包对接流程小记

美团小游戏rpk包对接流程小记 美团小游戏开发时,其实很简单,和各大厂差不多。 一、先贴个文档: 美团游戏开放平台文档地址: https://game.meituan.com/#/docs二、接入前准备: 与微信抖音小游戏的流程差不多&#xf…

解读 | 从谷歌AI判定阿波罗登月“造假“来谈谈合成图片检测技术

大家好,我是极智视界,欢迎关注我的公众号,获取我的更多前沿科技分享 邀您加入我的知识星球「极智视界」,星球内有超多好玩的项目实战源码和资源下载,链接:https://t.zsxq.com/0aiNxERDq 整个事情可以爬楼看…

Vue3的transition标签以及animate.css使用详解

一:前言 在项目开发中,有一种特殊情况是使用动画过渡去完成某个效果。比如淡入淡出,或者在动画完成后执行某些操作等。在以前开发中我们通常会选择使用 CSS3 进行研发。但是这样会有很多不好的地方,比如最原始化的封装&#xff0c…

Spring Security 6.x 系列(5)—— Servlet 认证体系结构介绍

一、前言 本章主要学习Spring Security中基于Servlet 的认证体系结构,为后续认证执行流程源码分析打好基础。 二、身份认证机制 Spring Security提供个多种认证方式登录系统,包括: Username and Password:使用用户名/密码 方式…

别做无用功!了解伦敦银交易指标的分类

在伦敦银投资中,我们都喜欢使用技术指标来帮助我们判断市场行情、预测银价点位。其实,伦敦银的技术指标是有不同分类的,我们了解主要的几类,这样在交易中才不至于将相同类型的叠加在一起,这样容易降低决策效率。 分类一…