python数学公式pdf文件的转换_python转换文件多种文件转换为pdf

1.office文件

这里用的是win32com, 需要注意已经安装的python版本是32位还是64位。

安装后导入

from win32com.client import Dispatch, constants, gencache, DispatchEx

(1) word转PDF

gencache.EnsureModule('{00020905-0000-0000-C000-000000000046}', 0, 8, 4)

w = DispatchEx("Word.Application")

doc = w.Documents.Open(docFile, ReadOnly=1)

doc.ExportAsFixedFormat(targetFile, constants.wdExportFormatPDF,

Item=constants.wdExportDocumentWithMarkup,

CreateBookmarks=constants.wdExportCreateHeadingBookmarks)

w.Quit(constants.wdDoNotSaveChanges)

(2) excel转PDF

xlApp = DispatchEx("Excel.Application")

xlApp.Visible = False #进程可见，False是它暗自进行

xlApp.DisplayAlerts = 0 #不跳出来。

books = xlApp.Workbooks.Open(excelFile,False)

books.ExportAsFixedFormat(0, targetFile)

books.Close(False)

xlApp.Quit()

(3) ppt转PDF

gencache.EnsureModule('{00020905-0000-0000-C000-000000000046}', 0, 8, 4)

p = Dispatch("PowerPoint.Application")

ppt = p.Presentations.Open(pptFile, False, False, False)

ppt.ExportAsFixedFormat(targetFile, 2, PrintRange=None)

p.Quit()

2. 图片文件

需要安装PIL 和 reportlab

安装完导入

from PIL import Image

from reportlab.lib.pagesizes import A4, landscape

from reportlab.pdfgen import canvas

图片转PDF

(w, h) = landscape(A4)

c = canvas.Canvas(self.getPdfName(fileName), pagesize = landscape(A4))

(xsize, ysize) = Image.open(fileName).size

ratx = xsize / w

raty = ysize / h

ratxy = xsize / (1.0 * ysize)

if ratx > 1:

ratx = 0.99

if raty > 1:

raty = 0.99

rat = ratx

if ratx < raty:

rat = raty

widthx = w * rat

widthy = h * rat

widthx = widthy * ratxy

posx = (w - widthx) / 2

if posx < 0:

posx = 0

posy = (h - widthy) / 2

if posy < 0:

posy = 0

c.drawImage(fileName, posx, posy, widthx, widthy)

c.showPage()

c.save()

3. html文件

需要安装pdfkit

安装后导入

import pdfkit

html转PDF

options={

'page-size':'Letter',

'margin-top':'0.75in',

'margin-right':'0.75in',

'margin-bottom':'0.75in',

'margin-left':'0.75in',

'encoding':"UTF-8",

'no-outline':None

}

pdfkit.from_file(htmlFile, targetFile, options)

需要注意的是：pdfkit需要和wkhtmltopdf配合使用。

安装后需要配置环境变量，将wkhtmltopdf.exe所在目录加上path中。

4. 文本文件

能用记事本等打开的文本文件，如txt文件，也可以用pdfkit工具来转换成pdf文件。

需要注意的是：

(1) 对于其它格式的文件，可以保存为txt文件之后再转换，因为有些不能被识别。

(2) 对于较大的文本文件，可以切割成多个文件，分别转换后，再把生成的多个pdf文件合并成一个pdf文件。

合并pdf文件可以用PyPDF2

安装后导入

from PyPDF2.pdf import PdfFileWriter, PdfFileReader

合并

pdf_output = PdfFileWriter()

files = []

for pdf in pdfList:

f = open(pdf, 'rb')

files.append(f)

pdf_input = PdfFileReader(f)

# 获取 pdf 共用多少页

page_count = pdf_input.getNumPages()

for i in range(page_count):

pdf_output.addPage(pdf_input.getPage(i))

pdf_output.write(open(targetFile, 'wb'))

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/news/489118.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

python数学公式pdf文件的转换_python转换文件多种文件转换为pdf

相关文章

rust矿洞绳子怎么爬下_rust矿洞绳子怎么爬下_打工小伙爬冰救人，每动一下都能听到冰面碎裂声...

Python爬虫入门四之Urllib库的高级用法

Magic Leap 价值 20 多亿美元的 AR 幻梦，现在醒了

mysql约束_不是吧，阿Sir，MySQL约束你竟然还不懂！

dc持久内存与mysql_Calypso Systems推出测试软件和服务器测试傲腾数据中心级持久内存...

计算机行业研究及2020年策略：聚焦主赛道，投资真成长（84页）

最长回文串_第78天——第78题（最长回文串）

python是后端语言还是前端语言_从前端到后台-语言选择

二进制权值计算 lsb_2020年二级计算机基础知识备考（第二章）

机器人产业这些领域大有可为

mysql数据库安全机制研究意义_MySQL数据库的安全机制

国产AI全面崛起！盘点11款2019年热门国产AI芯片

python中set函数作用如何自己用代码实现_Python进阶开发之元类编程

《构建之法》读书笔记（4）

【周末阅读】10年内，19个关键技术将改变世界

linux mysql安装_LINUX 安装 MYSQL

上传文件实时显示网速怎么实现_担心PC程序吃内存占网速？有了它终于放心了...

Jmeter生成html格式测试报告

python字符串怎么用_零基础如何使用python处理字符串？

iOS NSString 与NSData转化

python数学公式pdf文件的转换_python转换文件 多种文件转换为pdf

相关文章

python数学公式pdf文件的转换_python转换文件多种文件转换为pdf