利用python将图片转换为pdf格式的多种方法,实现批量转换,内置模板代码,全网最全,超详细!!!

文章目录

  • 前言
  • 1、img2pdf库的使用
    • 1.1 安装img2pdf库
    • 1.2 案例演示(模板代码)
  • 2、Pillow库的使用
    • 2.1 pillow库的安装
    • 2.2 案例演示(模板代码)
  • 3、PyMuPDF库的使用
    • 3.1 安装pymupdf库
    • 3.2 案例演示(模板代码)
    • 3.3 扩展:将多张图片完美拼接到一张pdf页面上,没有间隙

前言

在python中将图片转换为pdf格式的方法有多种,每种方法依赖于不同的库和工具,本篇文章我将介绍三种常用的库,包括img2pdf 库 和 pillow库、PyMuPDF(fitz)库 ,下面我将通过实际案例教会大家如何使用这三种库,同时针对每一种库不同的转换方法,准备相应的模板代码,让新手小白也能轻松驾驭。

图片准备: 可以看到我在下面准备了4张图片,后续案例中使用的都是这4张图片

在这里插入图片描述

1、img2pdf库的使用

在Python中,img2pdf 是一个方便的库,用于将图片转换为 PDF 格式。它基于 Pillow(PIL 的一个分支)库,并提供了一个简单的接口来完成图片到 PDF 的转换。

1.1 安装img2pdf库

命令:pip install img2pdf

1.2 案例演示(模板代码)


案例演示:

# 1、导入模块
from img2pdf import convert# 2、准备图片路径列表,将需要转换的图片路径全部放进一个列表中,若只有一张图片,同样也将其路径放入列表中即可
image_paths = ['all_images/01.png', 'all_images/02.png', 'all_images/03.png','all_images/04.png']# 3、使用convert函数将图片文件列表转换为 PDF,这里我们直接传递图片文件路径的列表
pdf_bytes = convert(image_paths)
# 注意:convert 函数只能接受一个图片文件对象的列表,或者一个包含图片文件路径的列表# 3、将转换后的图片,保存到指定路径下的pdf文件中
with open('output.pdf', 'wb') as pdf_file:pdf_file.write(pdf_bytes)print("PDF 文件已成功创建!")

执行效果:
在这里插入图片描述

说明:
我们可以看到,img2pdf库的使用是非常简单的,它会将每张图片作为 PDF 文件中的一个独立页面进行添加,有多少张图片就会生成多上张pdf页面

2、Pillow库的使用

通过 Pillow 库,你可以轻松地将单张或多张图片转换为 PDF 格式。这种方法简单高效,适合大多数图片转 PDF 的需求。如果需要更复杂的 PDF 操作(如添加文本、表格等),可以考虑结合 reportlab 库使用,这里我就不详细说明了,大家可以自行扩展。

2.1 pillow库的安装

命令:pip install Pillow

2.2 案例演示(模板代码)


案例1:将单张图片转换为 PDF

# 1、导入模块
from PIL import Image# 2、准备图片路径
image_path = 'all_images/01.png'# 3、准备输出的 PDF 路径
output_pdf_path = 'output.pdf'# 4、打开图片,生成图片对象
image = Image.open(image_path)# 5、将图片转换为pdf格式,并保存至指定路径
image.save(output_pdf_path, "PDF", resolution=100)
'''
参数说明:参数1:保存路径参数2:保存格式参数3:resolution,该参数用于设置pdf的分辨率,不写默认为75
'''
print(f"图片已成功转换为 PDF: {output_pdf_path}")

执行效果:

在这里插入图片描述


案例2:将多张图片合并为一个 PDF

# 1、导入模块
from PIL import Image# 2、准备图片路径列表
image_paths = ['all_images/01.png', 'all_images/02.png', 'all_images/03.png','all_images/04.png']# 3、准备输出的 PDF 路径
output_pdf_path = 'output.pdf'# 4、打开所有图片并使用convert函数将其转换为 RGB 模式,最后全部存入images列表中
images = [Image.open(image).convert('RGB') for image in image_paths]
# 因为pdf需要RGB格式,所以这里需要将其进行转换# 5、将第一张图片保存为 PDF,并追加其他图片
images[0].save(output_pdf_path, save_all=True, append_images=images[1:]) # 先将第一张图片保存为pdf文件,在通过append_images参数将剩余的图片追加进去
'''
参数说明:参数1:保存路径参数2:save_all=True,表示将所有图片都存入一个pdf文件中参数3:append_images=图片对象列表,指定要追加的图片对象列表
'''print(f"多张图片已成功合并为 PDF: {output_pdf_path}")

执行效果:
在这里插入图片描述

说明:
通过上面的案例,我们很轻松的通过pillow库将图片转换为了pdf格式,其中参数的使用也非常简单,但大家可能会对 resolution 参数 抱有疑问,接下来我将针对该参数为大家进行详细说明,如下:

在使用 Pillow 库将图片转换为 PDF 格式时,resolution 参数用于指定输出 PDF 的分辨率(DPI,Dots Per Inch)。分辨率决定了图片在 PDF 中的清晰度和尺寸。

resolution 参数的作用

  1. 控制图片的清晰度:

    分辨率越高,图片在 PDF 中显示的细节越清晰。

    分辨率越低,图片可能会显得模糊或像素化。

  2. 影响图片的尺寸:

    分辨率越高,图片在 PDF 中显示的尺寸越小(因为每英寸的像素点更多)。

    分辨率越低,图片在 PDF 中显示的尺寸越大。

  3. 默认值:

    如果未指定 resolution 参数,Pillow 会使用默认的分辨率(通常是 72 DPI)。

注意事项

  • 图片质量:

    分辨率不会改变原始图片的像素数据,但会影响其在 PDF 中的显示效果。

    如果原始图片的分辨率较低,即使设置高 resolution 参数,也无法提高其清晰度。

  • 文件大小:

    分辨率越高,生成的 PDF 文件可能越大。

  • 默认分辨率:

    如果不指定 resolution 参数,Pillow 会使用默认的 72 DPI。

总结
resolution 参数用于控制图片在 PDF 中的清晰度和显示尺寸。通过调整分辨率,可以优化 PDF 的显示效果,适应不同的需求(如打印或屏幕查看)。在实际使用中,建议根据具体场景选择合适的分辨率值。

3、PyMuPDF库的使用

PyMuPDF(fitz)库提供了强大的PDF和图像处理能力,它是一个强大的PDF处理库,它允许你读取、修改和创建PDF文件。它也支持从图片创建PDF。

3.1 安装pymupdf库

命令:pip install pymupdf

3.2 案例演示(模板代码)


案例1:将一张图片转换为pdf格式

方法1:

# 1、导入模块
import fitz# 2、打开一个新的PDF文档
pdf_document = fitz.open()# 3、加载图像文件,生成图片对象
image_file = fitz.open('all_images/01.png') # 替换为需要转换的图片路径# 4、使用convert_to_pdf函数将图片文件对象转换为pdf格式
image_pdf = image_file.convert_to_pdf()# 5、以pdf格式打开转换后的图像,生成pdf对象
pdf = fitz.open('pdf', image_pdf)# 6、向pdf文档中插入pdf对象
pdf_document.insert_pdf(pdf)# 7、将PDF文档保存至指定路径
pdf_document.save('output.pdf')  # 替换为你想要保存的PDF路径# 8、关闭图片文件和pdf文档,这两步默认可不写,但为了代码规范,我们可以加上
image_file.close()
pdf_document.close()print('图片已转换为pdf文档!')

执行效果:
在这里插入图片描述


方法2:

# 1、导入模块
import fitz# 2、打开一个新的PDF文档
pdf_document = fitz.open()# 3、加载图像文件
image_file = fitz.open('all_images/01.png') # 替换为你的图像路径# 4、加载图像所在的页面(通常是第一页),一般图片只有一页
image_page = image_file.load_page(0)# 5、获取图像的矩形区域(尺寸和位置,但这里我们可能只关心尺寸)
image_rect = image_page.rect
print(image_rect) # 返回 Rect(0.0, 0.0, 595.25, 841.75),前两个数字代表图片左上角的坐标,后两个数字代表图片右下角的坐标,同时也是图片的宽度和高度
'''方法说明:根据下面看两种方法可以得到图片宽度和高度1、image_rect.width:获取图片的宽度,595.252、image_rect.height:获取图片的宽度,841.75
'''# 6、创建一个新的PDF页面,这里我们指定其尺寸与图像相同(或根据需要调整)
pdf_page = pdf_document.new_page(width=image_rect.width, height=image_rect.height)
'''
参数说明:参数1:width,指定pdf页面的宽度参数2:height:指定pdf页面的高度
'''# 7、在PDF页面上插入图像
# 注意:这里我们假设图像应该覆盖整个页面,因此使用pdf_page.rect作为插入区域
pdf_page.insert_image(rect=pdf_page.rect, filename='all_images/01.png', stream=None)
'''
参数说明:参数1:rect= ,指定图片插入的位置,通常为pdf页面的矩形区域,也可以是图片的矩形区域,这里两者相同参数2:filename = 图片路径,指定要插入的图片参数3:stream=None,默认参数,表示允许指定图片以二进制格式插入pdf文档中
'''# 8、保存PDF文档
pdf_document.save('output.pdf')# 9、关闭图像文件和pdf文档,默认可不写,这里为了代码规范,我们可以写上
image_file.close()
pdf_document.close()print('图片已转换为了pdf文档!')

执行效果:

在这里插入图片描述


案例2:将多张图片转换为pdf文档

# 1、导入模块
import fitzdef images_to_pdf(image_paths, output_pdf):# 创建一个新的 PDF 文档pdf_document = fitz.open()# 遍历每一个图片路径for image_path in image_paths:# 打开图像文件,生成图片对象img = fitz.open(image_path)# 选择图片的第一页,生成矩形区域,用于获取图片的尺寸img_page = img.load_page(0).rect# 生成一张与图片大小相同的空白pdf页面         pdf_page = pdf_document.new_page(width=img_page.width, height=img_page.height)  # 根据图像大小设置页面尺寸# 将图像插入到 PDF 页面的指定位置(这里插入到页面的左上角)# 注意:如果图像大小与页面大小不匹配,可能需要调整 rect 参数以进行裁剪或缩放pdf_page.insert_image(rect=fitz.Rect(0, 0, pdf_page.rect.width, pdf_page.rect.height), filename=image_path,stream=None)'''说明:rect = fitz.Rect(0, 0, pdf_page.rect.width, pdf_page.rect.height) # 通过fitz.Rect方法可以手动调节图片插入的位置,前两个数字为图片左上角的坐标,后两个数字为图片右下角的坐标,这里就是pdf页面的宽度和高度'''# 关闭图像文件(对于 pymupdf,这通常是自动处理的,但显式关闭是个好习惯)img.close()# 保存 PDF 文档pdf_document.save(output_pdf)# 关闭 PDF 文档(对于 pymupdf,这也通常是自动处理的,但显式关闭可以避免潜在的资源泄露)pdf_document.close()# 2、准备图片路径列表
image_paths = ['all_images/01.png', 'all_images/02.png', 'all_images/03.png','all_images/04.png']  # 替换为要转换的图片路径  # 3、替换为你想要输出的 PDF 文件名
output_pdf = 'output.pdf'# 4、调用函数,并传入参数
images_to_pdf(image_paths, output_pdf)

执行效果:
在这里插入图片描述

3.3 扩展:将多张图片完美拼接到一张pdf页面上,没有间隙

通过前面的学习,我们已经掌握了三种将图片转换为pdf格式的方法,这三种方法都有一个共同点,它们会将每一张图片单独生成一张pdf页面,有多少张图片就会有多少张pdf页面,且每张pdf页面间都会有一段空白的填充区来分隔每张pdf页面,但是有时我们需要将多张连贯的图片转换为pdf格式,这时若按照原来的方法操作,每张图片间就会出现空白部分,影响观感,所以接下来我会依照这个问题,给出解决方法。

问题演示

在这里插入图片描述


解决方法(模板代码)

# 1、导入模块
import fitzdef images_to_single_pdf_page(image_paths, output_pdf):# 打开一个新的PDF文档pdf_document = fitz.open()# 初始化pdf页面总高度和最大宽度total_height = 0max_width = 0# 遍历所有图片文件以计算总高度和最大宽度(垂直拼接)for img_file in image_paths:# 打开图片文件,生成图片对象img_document = fitz.open(img_file)# 选择图片的第1页,一般图片都只有1页img_page = img_document.load_page(0)# 得到图片的矩形区域,用于获取图片的尺寸img_rect = img_page.rect# 获取图片的宽度和高度img_width, img_height = img_rect.width, img_rect.height# 累加高度并更新最大宽度total_height += img_heightif img_width > max_width:max_width = img_width# 关闭图片文档img_document.close()# 创建一个新的PDF页面,大小足以容纳所有图片pdf_page = pdf_document.new_page(width=max_width, height=total_height)# 初始化当前y位置,用于定义图片左上角的坐标current_y = 0# 初始化图片高度,用于定义图片右下角的坐标point_height = 0# 遍历所有图片文件并在PDF页面上绘制它们,不留空白for img_file in image_paths:# 打开图片文件,生成图片对象img_document = fitz.open(img_file)# 指定图片第一页,并形成矩形区域img_page = img_document.load_page(0).rect# 累加高度point_height += img_page.height# 在PDF页面上绘制图片(紧密排列,不留空白)pdf_page.insert_image(rect=fitz.Rect(0,current_y, img_page.width, point_height),filename=img_file, stream=None)'''说明:这里通过改变current_y 和 point_height 使图片依次垂直拼接在一张pdf页面上(0,current_y):表示每张图片插入pdf页面左上角的坐标(img_page.width, point_height):表示每张图片插入pdf右下角的坐标'''# 更新当前y位置以放置下一张图片(直接跳到下一张图片的起始位置)current_y += img_page.height# 关闭图片文档img_document.close()# 保存PDF文档至指定位置pdf_document.save(output_pdf)# 关闭PDF文档pdf_document.close()# 2、准备好图片路径列表
image_paths = ['all_images/01.png', 'all_images/02.png', 'all_images/03.png','all_images/04.png']  # 替换为要转换的图片路径# 3、替换为你想要输出的PDF文件路径
output_pdf = "output_all.pdf"# 4、调用函数,传入参数
images_to_single_pdf_page(image_paths, output_pdf)print('所有图片已全部拼接至一张pdf页面上!!!')

执行效果:
在这里插入图片描述

说明:
从上面我们可以看到,所有图片在转换为pdf格式后,全部拼接在了一张pdf页面上,且每张图片间没有空隙。


本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/891569.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Redis--高可用(主从复制、哨兵模式、分片集群)

高可用(主从复制、哨兵模式、分片集群) 高可用性Redis如何实现高可用架构?主从复制原理1. 全量同步2. 命令传播3. 增量同步 Redis Sentinel(哨兵模式)为什么要有哨兵模式?哨兵机制是如何工作的?…

Vue el-data-picker选中开始时间,结束时间自动加半小时

效果 思路 查阅elemnet plus官网,日期时间选择器type"datetimerange"这个选中开始时间并没有对应事件会被触发,因此思路更换成type"datetime"的两个组成一起可以通过监听开始时间v-model的值变化更新结束时间的值。 代码 日期时间…

19704 团建

存储哈希表&#xff08;一个键&#xff08;关键词&#xff09;对饮一个值&#xff09; 同步遍历两棵树 数的写入&#xff1a;节点的写入以及边的写入。 #include<bits/stdc.h> using namespace std; int ans0; const int N2e59; int a[N],b[N]; int n,m; int u,v;map&…

二维码文件在线管理系统-收费版

需求背景 如果大家想要在网上管理自己的文件&#xff0c;而且需要生成二维码&#xff0c;下面推荐【草料二维码】&#xff0c;这个系统很好。特别适合那些制造业&#xff0c;实体业的使用手册&#xff0c;你可以生成一个二维码&#xff0c;贴在设备上&#xff0c;然后这个二维码…

超强免费的Linux文件恢复工具R-Linux简介

&#xff08;首发地址&#xff1a;学习日记 https://www.learndiary.com/2024/12/r-linux/&#xff09; 一、Linux 误删除文件恢复的要点 删除文件后到恢复结束前&#xff0c;所在分区尽量避免进一步写操作&#xff1b;选择恰当的恢复工具。如: ext4magic、photorec。这里介绍…

【ArcGISPro/GeoScenePro】裁剪和打包栅格数据

检查并处理扫描地图 数据 https://arcgis.com/sharing/rest/content/items/535efce0e3a04c8790ed7cc7ea96d02d/data 使用标准相机或扫描仪创建的数字影像通常存储在 RGB 颜色模型中,这意味着这些影像将由红色、绿色和蓝色三个栅格组成。 此扫描地图在提供给您之前已在坐标系…

嵌入式入门Day35

网络编程 Day2 套接字socket基于TCP通信的流程服务器端客户端TCP通信API 基于UDP通信的流程服务器端客户端 作业 套接字socket socket套接字本质是一个特殊的文件&#xff0c;在原始的Linux中&#xff0c;它和管道&#xff0c;消息队列&#xff0c;共享内存&#xff0c;信号等…

数仓建模:如何进行实体建模?

目录 1 如何进行实体建模? 业务建模 领域建模 逻辑建模 2 实体建模具体步骤 需求分析

爬虫后的数据处理与使用(处理篇)

紧接上文爬虫&#xff0c;我们获取到了一些数据&#xff0c;接下来就是使用和分析了~爬虫阶段式教学——从数据获取到格式化存储&#xff08;附代码与效果图&#xff09;_爬虫网页数据格式化-CSDN博客 为保证数据的正确性和有效性需要对数据进行筛选&#xff0c;保存有效信息&a…

PostgreSQL的备份方式

PostgreSQL 提供多种方式进行备份&#xff0c;适用于不同需求的场景。常用的备份方法如下&#xff1a; 1. 逻辑备份&#xff08;pg_dump 和 pg_dumpall&#xff09; 1.1 使用 pg_dump 备份单个数据库 pg_dump 是 PostgreSQL 内置的逻辑备份工具&#xff0c;可以将数据库导出为…

人工智能之基于阿里云图像人脸融合部署

人工智能之基于阿里云图像人脸融合部署 需求描述 基于阿里云搭建图像人脸融合模型&#xff0c;模型名称&#xff1a;iic/cv_unet-image-face-fusion_damo使用上述模型输出人脸融合照片 模型路径&#xff1a;人脸融合 业务实现 阿里云配置 阿里云配置如下&#xff1a; SD…

【TextIn—智能文档解析与DocFlow票据AI自动化处理:赋能企业文档数字化管理与数据治理的双重利器】

TextIn—智能文档解析与票据AI自动化处理&#xff1a;赋能企业文档数字化管理与数据治理的双重利器 ​ 在数据驱动的时代&#xff0c;企业面临的挑战不仅在于海量数据的整理和响应速度的提高&#xff0c;更在于如何有效管理和利用这些日益增长的海量信息。尤其是在信息日趋多样…

AI大模型系列之七:Transformer架构讲解

目录 Transformer网络是什么&#xff1f; 输入模块结构&#xff1a; 编码器模块结构&#xff1a; 解码器模块: 输出模块结构&#xff1a; Transformer 具体是如何工作的&#xff1f; Transformer核心思想是什么&#xff1f; Transformer的代码架构 自注意力机制是什么…

uni-ui样式修改

因为之前官网uni-ui有些组件的样式不好看&#xff0c;所以要做一些调整&#xff0c;做个记录。用分段器举例~ 官网原生样式 调整后的 首先找到我们的static文件夹&#xff0c;里面一般存着项目的全局样式文件&#xff0c;没有的话自己创一个 uniui.scss /deep/ .segmented-con…

【SqlSugar雪花ID常见问题】.NET开源ORM框架 SqlSugar 系列

系列文章目录 &#x1f380;&#x1f380;&#x1f380; .NET开源 ORM 框架 SqlSugar 系列 &#x1f380;&#x1f380;&#x1f380; 文章目录 系列文章目录一、前言 &#x1f343;二、ORM中使用雪花ID ❄️2.1 普通插入2.2 导航插入2.3 手动调用雪花ID 三、雪花ID重复 问题 …

有序归并(JOIN 简化和提速系列 8)

八、有序归并 我们再来看同维表和主子表的 JOIN&#xff0c;这两种情况的优化提速手段是类似的。 我们前面讨论过&#xff0c;HASH JOIN 算法的计算复杂度&#xff08;即关联键的比较次数&#xff09;是 sum(ni*mi)&#xff0c;比全遍历的复杂度 n*m 要小很多&#xff0c;不过…

详细教程:SQL2008数据库备份与还原全流程!

数据的安全性至关重要&#xff0c;无论是操作系统、重要文件、磁盘存储&#xff0c;还是企业数据库&#xff0c;备份都是保障其安全和完整性的关键手段。拥有备份意味着即使发生误删、系统崩溃或病毒攻击等问题&#xff0c;也能迅速通过恢复功能解决&#xff0c;避免数据丢失带…

低代码开发:开启企业数智化转型“快捷键”

一、低代码开发浪潮来袭&#xff0c;企业转型正当时 在当今数字化飞速发展的时代&#xff0c;低代码开发已如汹涌浪潮&#xff0c;席卷全球。从国际市场来看&#xff0c;诸多企业巨头纷纷布局低代码领域&#xff0c;像微软的 PowerApps、OutSystems 等平台&#xff0c;凭借强大…

MySQL数据库——常见慢查询优化方式

本文详细介绍MySQL的慢查询相关概念&#xff0c;分析步骤及其优化方案等。 文章目录 什么是慢查询日志&#xff1f;慢查询日志的相关参数如何启用慢查询日志&#xff1f;方式一&#xff1a;修改配置文件方式二&#xff1a;通过命令动态启用 分析慢查询日志方式一&#xff1a;直…

C# 设计模式(结构型模式):享元模式

C# 设计模式&#xff08;结构型模式&#xff09;&#xff1a;享元模式 (Flyweight Pattern) 在软件开发中&#xff0c;尤其是在处理大量对象时&#xff0c;我们常常会面临内存和性能上的挑战。当多个对象具有相似的状态时&#xff0c;通常会占用大量的内存资源&#xff0c;从而…