python 使用 pdf2image 库将PDF转换为图片

python 使用 pdf2image 库将PDF转换为图片

  • 环境
    • 步骤一:安装pdf2image库
    • 步骤二:导入必要的库
    • 步骤三:指定PDF文件路径
    • 步骤四:将PDF转换为图片
    • 步骤五:保存图像为图片文件
    • 完整代码
    • 运行结果

在数字化时代,PDF(Portable Document Format)文件成为了一种常见的文件格式,但有时我们需要将PDF文件转换成图片以便于在网页、演示文稿或其他应用中使用。本文将介绍如何使用Python的pdf2image库来将PDF文件转换为图片

希望能写一些简单的教程和案例分享给需要的人

环境

Python 3.10.12
系统: ubuntu 22.04

步骤一:安装pdf2image库

首先,我们需要安装pdf2image库,这可以通过以下命令在命令行中进行安装:

pip install pdf2image

在这里插入图片描述

步骤二:导入必要的库

在您的Python脚本中,首先导入所需的库,包括我们即将使用的pdf2image库:

from pdf2image import convert_from_path

步骤三:指定PDF文件路径

将要转换为图片的PDF文件放置在您选择的路径下,并将该路径赋值给变量pdf_path

pdf_path = 'test.pdf'

请确保将test.pdf替换为您实际的PDF文件路径。

步骤四:将PDF转换为图片

使用convert_from_path函数从指定的PDF文件中提取图像,并将它们存储在一个名为images的列表中:

images = convert_from_path(pdf_path)

步骤五:保存图像为图片文件

遍历images列表,将每个图像保存为JPEG格式的图片文件。我们使用循环为每个图像文件命名,命名格式为page_i.jpg,其中i表示页码:

for i, image in enumerate(images):image.save(f'page_{i + 1}.jpg', 'JPEG')

当这一步骤完成后,您将在脚本所在的目录中找到与PDF文件页数对应的图片文件。

在这里插入图片描述

完整代码

from pdf2image import convert_from_pathpdf_path = 'test.pdf'
images = convert_from_path(pdf_path)for i, image in enumerate(images):image.save(f'page_{i + 1}.jpg', 'JPEG')

加上注释的代码如下:

# 导入所需库
from pdf2image import convert_from_path# 指定PDF文件路径
pdf_path = 'test.pdf'# 将PDF文件转换为图片
images = convert_from_path(pdf_path)# 遍历图片列表并保存为图片文件
for i, image in enumerate(images):image.save(f'page_{i + 1}.jpg', 'JPEG')

运行结果

python3 run.py

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/52299.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

如何在 Ubuntu 中安装最新的 Python 版本

动动发财的小手,点个赞吧! Python 是增长最快的主要通用编程语言。其原因有很多,例如其可读性和灵活性、易于学习和使用、可靠性和效率。 目前使用的 Python 有两个主要版本 – 2 和 3(Python 的现在和未来)&#xff1…

Unity——动效与缓动动画

游戏体验是综合性的,音效、剧情、界面设计、美术风格和玩法内涵都是游戏体验的组成部分。而且一些细节上的美化,会出乎意料地带给用户愉悦感和满足感。这些细节包括跳跃的图标、闪烁的文字、流畅滑动的通讯录等,可以统称为动态效果或动效。 …

通过运行中的容器生成 Docker Compose 配置文件

背景 笔者之前有一次不小心删除了原始的 docker-compose.yml 文件,不过正在运行的 Docker 容器还在,找了许久,发现一个方法可以从这些容器中生成一个等效的 Docker Compose 配置文件。本文将介绍使用 autocompose 工具从正在运行的容器中反向…

http协议和HTTP编程流程

目录 1、http协议 (1)概念 (2)使用的端口 (3)长连接和短连接 (4)常见web服务器 2、https(443) 3、浏览器连接服务器编程 1、http协议 (超文…

mysql insert出现主键冲突错误的解决方法

mysql insert出现主键冲突错误的解决方法 insert 时防止出现主键冲突错误的方法 在mysql中插入数据的时候常常因为主键存在而冲突报错,下面有两个解决方法: 1 在insert 语句中添加ignore 关键字 insert ignore into table (id,name) values (1,username)…

Linux下的系统编程——makefile入门(四)

前言: 或许很多Winodws的程序员都不知道这个东西,因为那些Windows的IDE都为你做了这个工作,但我觉得要作一个好的和professional的程序员,makefile还是要懂。这就好像现在有这么多的HTML的编辑器,但如果你想成为一个专…

【git】工作场景中常用的git命令

工作场景中常用的git命令 1. 必备改名改邮箱拉代码下来并且创建新分支git commit回滚某个文件删除分支 工作场景中常用的git命令,记录下来方便调取 1. 必备 改名改邮箱 一般与他人合作,至少你提交的名字得被人熟知或者遵循规范,因此需要更改…

【业务功能篇74】三高微服务项目springboot-springcloud

三高指的是:高性能、高并发、高可用 2.项目架构 2.1 系统架构图 整体的项目架构图如下 2.2 业务组成 整体的项目业务组成如下

ubuntu can应用开发环境搭建指南

sudo apt-get update sudo apt-get install can-utils libsocketcan-dev can数据发送这个采用来自网上的一段代码进行测试: can_send.c代码内容如下: /* 1. 报文发送程序 */ #include <stdio.h> #include <stdlib.h> #include <string.h> #include <…

SpringCloud

SpringCloud组件 服务注册中心/服务治理 Eureka&#xff1a;Java 写的&#xff0c;官网停止更新&#xff0c;AP&#xff0c;可视化页面&#xff0c;可以设置自我保护机制开关Zookeeper&#xff1a;CP&#xff0c;Java 写的&#xff0c;临时节点&#xff0c;没有可视化页面Cons…

GO学习之 数据库(Redis)

GO系列 1、GO学习之Hello World 2、GO学习之入门语法 3、GO学习之切片操作 4、GO学习之 Map 操作 5、GO学习之 结构体 操作 6、GO学习之 通道(Channel) 7、GO学习之 多线程(goroutine) 8、GO学习之 函数(Function) 9、GO学习之 接口(Interface) 10、GO学习之 网络通信(Net/Htt…

Python 密码破解指南:10~14

协议&#xff1a;CC BY-NC-SA 4.0 译者&#xff1a;飞龙 本文来自【OpenDocCN 饱和式翻译计划】&#xff0c;采用译后编辑&#xff08;MTPE&#xff09;流程来尽可能提升效率。 收割 SB 的人会被 SB 们封神&#xff0c;试图唤醒 SB 的人是 SB 眼中的 SB。——SB 第三定律 十、加…

VSCode 如何解决 scanf 的输入问题——Code is already running!

文章如何使用 VSCode 软件运行C代码中已经介绍了如何在 VSCode 软件中运行C代码&#xff0c;但最近在使用 scanf 想从键盘输入时&#xff0c;运行代码后显示“Code is already running!”&#xff0c;如下图所示&#xff0c;在输出窗口是无法通过键盘输入的。 解决办法如下&am…

TCP编程流程

目录 1、主机字节序列和网络字节序列 2、套接字地址结构 3、IP地址转换函数 4、TCP协议编程&#xff1a; &#xff08;1&#xff09;服务器端&#xff1a; &#xff08;2&#xff09;客户端: 1、主机字节序列和网络字节序列 主机字节序列分为大端字节序和小端字节序 大端…

Qt 阴影边框

阴影边框很常见&#xff0c;诸如360以及其他很多软件都有类似效果&#xff0c;了解CSS3的同学们应该都知道box-shadow&#xff0c;它就是来设定阴影效果的&#xff0c;那么Qt呢&#xff1f;看过一些资料&#xff0c;说是QSS是基于CSS2的&#xff0c;既然如此&#xff0c;box-sh…

Docker安装Oracle数据库打开、链接速度很慢

问题&#xff1a; 使用Docker安装Oracle数据库打开、链接速度很慢&#xff0c;明显的在在转圈严重影响效率。 解决&#xff1a; 排查到DNS时&#xff0c;发现宿主机DNS配置清空后&#xff0c;通过JDBC连接目标Oracle数据库速度很快 进入容器中进行测试&#xff0c;发现清空DNS…

【核磁共振成像】方格化重建

目录 一、缩放比例二、方格化变换的基础三、重建时间四、方格化核 一、缩放比例 对于笛卡尔K空间直线轨迹数据可直接用FFT重建&#xff0c;而如果K空间轨迹的任何部分都是非均匀取样的 可用DFT直接重建&#xff0c;有时称为共轭相位重建&#xff0c;但此法太慢不实用。把数据再…

window如何实时刷新日志文件

1 安装windows git 下载地址&#xff1a;Git - Downloading Package (git-scm.com) 2 打开git bash 输入tail.exe -f 日志文件路径

CSS3盒模型+flex

1.盒模型 标准盒模型: wwidthpaddingborderhheightpaddingborder 怪异盒模型(ie盒模型) wwidth包含了(paddingborder)hheight包含了(paddingborder) 2.CSS3弹性盒(重点新版弹性盒) 弹性盒: 设置为弹性盒后,父元素为容器,子元素为项目弹性盒中存在两根轴,默认水平为主轴,垂…

chrom扩展开发配合百度图像文字识别实现自动登录(后端.net core web api)

好久没做浏览器插件开发了&#xff0c;因为公司堡垒机&#xff0c;每次登录都要输入账号密码和验证码。太浪费时间了&#xff0c;就想着做一个右键菜单形式的扩展。 实现思路也很简单&#xff0c;在这里做下记录&#xff0c;方便下次开发参考。 一&#xff0c;先来了解下chro…