python 基于 docx 文件模板生成 docx 或 PDF 文件

需求背景

提供一个Word文档模板,使用python程序替换里边的占位符,替换内容包括文本和图片,然后输出docx或者PDF文件。

功能演示

输入示例

在这里插入图片描述

输出示例

在这里插入图片描述

实现程序

import os
import shutil
import subprocess
import timefrom docx import Document
from docx.shared import Ptclass DocFiller:def __init__(self, doc_file_path, libreoffice_path=None):self.doc = Document(doc_file_path)self.libreoffice_path = libreoffice_pathdef _process_paragraphs(self, paragraphs, placeholders):# 遍历处理每个段落for paragraph in paragraphs:# 遍历处理每个段落中的每个runfor run in paragraph.runs:self._process_run(run, placeholders)@staticmethoddef _process_run(run, placeholders):for placeholder, replacement in placeholders.items():# 文本替换if isinstance(replacement, str):run.text = run.text.replace(placeholder, replacement)# 图片替换elif isinstance(replacement, tuple) and len(replacement) == 3:image_path, width, height = replacementif placeholder in run.text:# 保留占位符前后文本,只替换占位符部分texts = run.text.split(placeholder, 1)run.clear()run.add_text(texts[0])run.add_picture(image_path, width=Pt(width), height=Pt(height))run.add_text(texts[1])def _process_tables(self, doc_tables, placeholders):for table in doc_tables:for row in table.rows:for cell in row.cells:self._process_paragraphs(cell.paragraphs, placeholders)def fill(self, placeholders):self._process_paragraphs(self.doc.paragraphs, placeholders)self._process_tables(self.doc.tables, placeholders)def convert_to_pdf(self, docx_path, pdf_path):output_dir = os.path.dirname(pdf_path)temp_pdf_path = os.path.join(output_dir, os.path.basename(docx_path).rsplit('.', 1)[0] + '.pdf')try:subprocess.run([self.libreoffice_path, '--headless', '--convert-to', 'pdf:writer_pdf_Export','--outdir', output_dir, docx_path], check=True)shutil.move(temp_pdf_path, pdf_path)print(f"conversion successful: {pdf_path}")except subprocess.CalledProcessError as e:print(f"convert the document error: {e}")def to_docx(self, outputfile):self.doc.save(path_or_stream=outputfile)print('to docx complete')def to_pdf(self, outputfile):temp_file = f'{int(time.time() * 1e6)}.docx'self.to_docx(temp_file)try:self.convert_to_pdf(temp_file, outputfile)finally:os.remove(temp_file)print('to pdf complete')if __name__ == '__main__':liberoffice = 'D:/LibreOffice/program/soffice.exe'd = DocFiller('template.docx', liberoffice)data = {'{{meeting_time}}': '2024年12月12日 下午3点半','{{meeting_address}}': '中央会议室','{{host}}': '小白','{{photo}}': ('./0.png', 80, 80),'{{image1}}': ('./1.jpg', 8, 8),'{{image2}}': ('./2.jpg', 300, 200)}d.fill(data)# 生成docx文件# d.to_docx('data/output.docx')# 生成pdf文件d.to_pdf('data/output.pdf')

说明

  1. 本程序依赖python-docx库和liberoffice,可以实现docx文件模板内容替换。
  2. 如果替换后只需生成Word文档,则无需安装liberoffice,也不用指定liberoffice可执行文件路径。
  3. 如果需要生成PDF文件,则需要安装liberoffice,并将程序中的liberoffice可执行文件路径修改为自己的路径。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/64157.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

深入解析 Pytest 中的 conftest.py:测试配置与复用的利器

在 Pytest 测试框架中,conftest.py 是一个特殊的文件,用于定义测试会话的共享配置和通用功能。它是 Pytest 的核心功能之一,可以用于以下目的: 【主要功能】 1、定义共享的 Fixture (1)conftest.py 文件可…

【Python篇】PyQt5 超详细教程——由入门到精通(序篇)

文章目录 PyQt5 超详细入门级教程前言序篇:1-3部分:PyQt5基础与常用控件第1部分:初识 PyQt5 和安装1.1 什么是 PyQt5?1.2 在 PyCharm 中安装 PyQt51.3 在 PyCharm 中编写第一个 PyQt5 应用程序1.4 代码详细解释1.5 在 PyCharm 中运…

【Axure教程】动态统计字数

动态统计字数通常用于文本编辑、编程、社交媒体、写作工具、SEO优化、表单与调查以及数据分析等场景,帮助用户实时跟踪文字量,保证内容符合特定的格式或要求,提高工作效率和质量。 今天我们就来学习,怎么在Axure中制作能根据输入…

LeetCode 3266.K 次乘运算后的最终数组 II:堆(快速幂)

【LetMeFly】3266.K 次乘运算后的最终数组 II:堆(快速幂) 力扣题目链接:https://leetcode.cn/problems/final-array-state-after-k-multiplication-operations-ii/ 给你一个整数数组 nums ,一个整数 k 和一个整数 m…

【YashanDB知识库】oracle与yashanDB的jdbc返回常量列“0.00“的精度和刻度不一致

本文内容来自YashanDB官网,原文内容请见 https://www.yashandb.com/newsinfo/7610110.html?templateId1718516 问题现象 客户预期常量列"0.00"应该映射到java里的浮点类型,结果却是跑到整型。 1、应用的sql 2、应用的java代码 3、执行结果…

Ripro V5日主题 v8.3 开心授权版 wordpress主题虚拟资源下载站首选主题模板

RiPro主题全新V5版本,是一个优秀且功能强大、易于管理、现代化的WordPress虚拟资源商城主题。支持首页模块化布局和WP原生小工具模块化首页可拖拽设置,让您的网站设计体验更加舒适。同时支持了高级筛选、自带会员生态系统、超全支付接口等众多功能&#…

前端页面图片滑动验证

开源项目地址&#xff1a;monoplasty/vue3-slide-verify 安装命令&#xff1a; npm install --save vue3-slide-verify 在登录页面添加代码&#xff1a; <template> <!-- 登录验证码对话框 --> <el-dialog v-model"dialogVisible" title"验…

pyhton 批量往PDF文件指定位置里面填写数据

pyhton 批量往PDF文件指定位置里面填写数据 import PyPDF2 from PyPDF2 import PdfReader, PdfWriterdef modify_pdf(input_pdf_path, output_pdf_path, page_number, x, y, text):reader PdfReader(input_pdf_path)writer PdfWriter()for page in reader.pages:writer.add_p…

MySQL迁移SQLite 借助PYTHON脚本

使用 Python 脚本将 MySQL 数据库迁移到 SQLite 是一种灵活且强大的方法。 下面是一个基本的脚本示例&#xff0c;使用 pandas 和 sqlite3 库来实现这一过程。 这个脚本假设你已经安装了 pandas 和 mysql-connector-python 库。 步骤 安装必要的库: 如果尚未安装&#xff…

CAPL如何设置或修改CANoe TCP/IP协议栈的底层配置

在CANoe中创建网络节点作为以太网主机时,可以给其配置独立的TCP/IP Stack。 配置的协议栈有一些底层配置参数可以在界面上设置或修改,比如: MTU上图中MTU显示500只是图形界面显示错误,正确值是1500。 TCP延迟确认这些参数也可以通过CAPL动态配置,甚至CAPL还可以配置很多界…

县城楼市踩踏式降价,或现2字头,率先回归月薪一平方的合理价格

在一二线城市都在欢呼10月份、11月份成交量回升&#xff0c;楼价回稳的时候&#xff0c;广东一些县城却先顶不住了&#xff0c;大举降价&#xff0c;显示出县城楼市房价率先回归月薪一平方的合理水平&#xff0c;这将对全国楼市产生巨大影响。 据了解这个县城的楼价此前较为稳定…

【前端面试题】书、定位问题、困难

看过什么书 《JavaScript 高级程序设计&#xff08;第 4 版&#xff09;》&#xff08;作者&#xff1a;Matt Frisbie&#xff09; 这是一本深入学习 JavaScript 语言的经典书籍。它详细地涵盖了 JavaScript 的高级特性&#xff0c;包括原型链、闭包、异步编程等复杂概念。以闭…

利用Docker分层构建优化镜像大小

合适docker镜像文件大小不仅影响容器启动效率&#xff0c;也影响资源占用效率。本文介绍如何利用分层方式构建docker镜像&#xff0c;采用多种方式避免镜像文件太大而影响性能。 Docker 镜像大小优化的重要性 资源利用效率 较小的镜像文件在存储和传输过程中占用更少的空间和带…

深度学习面试相关-2024.12.15记录

深度学习 面试相关- 2024.12.15记录 目录 深度学习 面试相关- 2024.12.15记录整体常问问题1数学基础1.1 概率统计1.2 线代 2机器学习算法2.1 深度学习算法2.2 机器学习算法 整体常问问题 https://www.nowcoder.com/discuss/353154899112304640 1数学基础 1.1 概率统计 htt…

大模型呼出机器人能够解决哪些问题?

大模型呼出机器人能够解决哪些问题&#xff1f; 原作者&#xff1a;开源呼叫中心FreeIPCC&#xff0c;其Github&#xff1a;https://github.com/lihaiya/freeipcc 大模型呼出机器人作为现代科技在客户服务领域的创新应用&#xff0c;能够解决多个方面的问题&#xff0c;以下是…

Python面试常见问题及答案4

一、内存管理相关 问题&#xff1a;Python中的垃圾回收机制是如何工作的&#xff1f; 答案&#xff1a;Python主要使用引用计数来进行垃圾回收&#xff0c;当对象的引用计数为0时&#xff0c;该对象就会被垃圾回收器回收。此外&#xff0c;Python还有一个循环垃圾收集器来处理循…

从零用java实现 小红书 springboot vue uniapp (2)主页优化

前言 移动端演示 http://8.146.211.120:8081/#/ 前面的文章我们基本完成了主页的布局 今天我们具体的去进行实现 并且分享我开发时遇到的问题 首先先看效果 java仿小红书主页 实现效果为 1.顶端全屏切换 2.上划加载更多 3.下拉当前页整体刷新 顶端全屏切换我们选择 gui-switch…

idea 配置 git .gitignore文件配置

.gitignore 内容 .idea/ *.iml target/ *.class *.log .iml在idea项目里面创建一个.gitignore名字的文件&#xff0c;然后把这个文件提交到git上。我一般是放到.idea同级目录。 我遇到了几种情况这个文件配置了但是不生效的情况 第一种 Git的缓存可能会导致配置不生效。尝试…

linux 下nmcli命令使用方法

1、nmcli 是 NetworkManager Command Line Interface 的缩写。 详细解释 NetworkManager: 是 Linux 上常用的网络管理工具&#xff0c;负责管理有线、无线、VPN 等网络连接。 Command Line Interface (CLI): 意味着 nmcli 是 NetworkManager 的命令行界面工具&#xff0c;提…

双指针---移动0

常见的双指针有两种形式&#xff0c;⼀种是对撞指针&#xff0c;⼀种是快慢指针。 这里写自定义目录标题 题目链接 [移动0](https://leetcode.cn/problems/move-zeroes/description/)问题分析代码解决 题目链接 移动0 问题分析 在本题中&#xff0c;我们可以⽤⼀个 cur 指针来…