Python docx学习笔记

个人学习笔记。

1 工具介绍

python-docx 是用于创建可修改 微软 Word 的一个 python 库,提供全套的 Word 操作,是最常用的 Word 工具。

1.1 基本概念

  • Document:是一个 Word 文档 对象,不同于 VBA 中 Worksheet 的概念,Document 是独立的,打开不同的Word 文档,就会有不同的 Document 对象,相互之间没有影响。
  • Paragraph:是段落,一个 Word 文档由多个段落组成,当在文档中输入一个回车键,就会成为新的段落,输入 shift + 回车,不会分段。
  • Run: 表示一个节段,每个段落由多个节段组成,一个段落中具有相同样式的连续文本,组成一个节段,所以一个 段落对象有多个 Run 列表。
    在这里插入图片描述

1.2 对象介绍

此处只列出部分,剩余的部分,见官方文档介绍。

1.2.1 Document objects

整篇word文档的对象,可以对该对象添加标题、段落、表格、图片等信息。

在这里插入图片描述

1.2.2 Paragraph objects

段落对象,可以在段落里面添加一个节段、段落前添加一个段落(不支持在后面添加)、设置格式等。
在这里插入图片描述

1.2.3 Table objects

表格对象,常规的添加行、列、合并单元格等。
在这里插入图片描述

2 实操

实现功能:在word文档的指定位置添加相应的宏定义和函数定义

2.1 准备材料

word文档模板:
在这里插入图片描述
备注:
1、需要现在word文档中设置好自动编号(关联到相应标题)
2、相应标题格式(字体颜色、大小等)需要提前调整,脚本只是应用,占时不修改属性

2.2 运行结果

在这里插入图片描述

2.3 代码

from docx import Document
from docx.enum.table import WD_ALIGN_VERTICAL  # 导入单元格垂直对齐
from docx.shared import Cm, Inches, Pt
import reColumn = 4   # 设置表格列数
# 这里添加表格内容,具体内容后期提取代码或提前PDF文档
EnumInfo = [{'Name': 'Crypto_AlgorithmFamilyType', 'kind': 'Enumeration','Range': [['CRYPTO_ALGOFAM_NOT_SET', '0x00', 'Algorithm family is not set'],['CRYPTO_ALGOFAM_SHA1', '0x01', 'SHA1 hash'],['CRYPTO_ALGOFAM_SHA2_224', '0x01', 'SHA2-224 hash']],'Description': 'Enumeration of the algorithm family.', 'Availablevia': 'Crypto_GeneralTypes.h'},{'Name': 'Crypto_InputOutputRedirectionConfigType', 'kind': 'Enumeration','Range': [['CRYPTO_REDIRECT_CONFIG_PRIMARY_INPUT', '0x01', '--'],['CRYPTO_REDIRECT_CONFIG_SECONDARY_INPUT', '0x02', '--']],'Description': 'Defines which of the input/output parameters are re-directed to a key element. Thevalues can be combined to define a bit field.','Availablevia': 'Crypto_GeneralTypes.h'}]def addEnum(document, paragraph):for type in EnumInfo:paragraph1 = paragraph.insert_paragraph_before(type['Name'], style='Heading 3')lineNumber = 0table1 = document.add_table(4, Column, style='Table Grid')  # 添加一个4行4列的表格,表格样式为Table Gridtable1.autofit = Falsetable1.allow_autofit = False# 设置表格宽度table1.columns[0].width = Cm(2)table1.columns[1].width = Cm(4)table1.columns[2].width = Cm(1.5)table1.columns[3].width = Cm(8)# 设置第一行高度为1cmtable1.rows[0].height = Cm(1)# 填充Name信息table1.cell(lineNumber, 0).text = 'Name'table1.cell(lineNumber, 1).merge(table1.cell(lineNumber, 2)).merge(table1.cell(lineNumber, 3))table1.cell(lineNumber, 1).text = type['Name']lineNumber = lineNumber + 1# 填充Kind信息table1.cell(lineNumber, 0).text = 'kind'table1.cell(lineNumber, 1).merge(table1.cell(lineNumber, 2)).merge(table1.cell(lineNumber, 3))table1.cell(lineNumber, 1).text = type['kind']lineNumber = lineNumber + 1# 填充具体的枚举数据for i in range(0, len(type['Range'])):table1.cell(lineNumber + i, 1).text = type['Range'][i][0]table1.cell(lineNumber + i, 2).text = type['Range'][i][1]table1.cell(lineNumber + i, 3).text = type['Range'][i][2]table1.add_row()lineNumber = lineNumber + len(type['Range'])  # 计算下一行的索引# 合并第一列表格(枚举相关的行)for i in range(2, lineNumber - 1):  # 总共需要合并lineNumber - 1次table1.cell(i, 0).merge(table1.cell(i + 1, 0))table1.cell(2, 0).text = 'Range'table1.cell(2, 0).vertical_alignment = WD_ALIGN_VERTICAL.CENTER  # 设置为水平居中# 填充Description、Availablevia信息table1.cell(lineNumber, 0).text = 'Description'table1.cell(lineNumber, 1).merge(table1.cell(lineNumber, 2)).merge(table1.cell(lineNumber, 3))table1.cell(lineNumber, 1).text = type['Description']lineNumber = lineNumber + 1table1.cell(lineNumber, 0).text = 'Availablevia'table1.cell(lineNumber, 1).merge(table1.cell(lineNumber, 2)).merge(table1.cell(lineNumber, 3))table1.cell(lineNumber, 1).text = type['Availablevia']move_table_after(table1, paragraph1)  # 移动到段落后面(表格只能创建到文档末尾)
# 函数功能:移动指定表格到段落后面
def move_table_after(table, paragraph): tbl, p = table._tbl, paragraph._pp.addnext(tbl)def main():# 实例化一个Document对象,相当于打开word软件,新建一个空白文件document = Document('test.docx')for paragraph in document.paragraphs:if (paragraph.style.name.startswith('Heading')):  # 识别标题,注意:这里是在标题前添加相关信息,若要在枚举章节添加枚举定义,则需要识别下一个章节标题if re.search('函数接口定义', paragraph.text):   # 实际是编辑上一个章节“枚举类型定义”的内容passelif re.search('其他', paragraph.text):        # 编辑“函数接口定义内容”addEnum(document, paragraph)  # 添加枚举类型document.save(f"test.docx")if __name__ == "__main__":main()

3 参考资料

3.1 官方链接

https://python-docx.readthedocs.io/en/latest/index.html#

在这里插入图片描述
刚入门可以看该章节快速上手,具体API和对象的熟悉可以看下面的“API Documentation”。
在这里插入图片描述

3.2 其他博主

强烈推荐学习此博主的博文,本文部分内容从中摘选。

https://blog.csdn.net/yuetaope/article/details/119444970

4. 其他

Python提取PDF表格(基于AUTOSAR_SWS_CANDriver.pdf

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/740176.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

李彦宏最新发声,“程序员”职业将不复存在!

文章目录 “程序员”职业不存在周鸿祎的看法我怎么看 昨天,百度一则新闻冲上了微博和知乎热搜。 “程序员”职业不存在 关于李彦宏的这个观点,瞬间激起热烈讨论。有赞同的、有直接开喷的,也有看热闹不嫌事大的。还有网友将这个问题抛给你百度…

嵌入式系统工程师错题总结

笔者来介绍一下嵌入式系统工程师考试的一些易错题目 题目介绍  流水线指令计算公式:一条指令总时间max(单个指令执行时间)*(指令数-1)  平均故障间隔时间  ICMP协议:传送通信问题相关的消息。 …

【网络】数据在同网段和跨网段通信流程

情景一&#xff1a;同一广播域内&#xff0c;两台主机通信过程&#xff1a; 当NO要和N1通信时&#xff0c;假如N0知道N1的IP但却不知道它的MAC地址&#xff0c;那NO就会发送一个ARP的广播请求<1>&#xff08;里面源IP是NO 目标IP是N1 源MAC是N0 目标MAC是12个F&#xff0…

Learn OpenGL 08 颜色+基础光照+材质+光照贴图

我们在现实生活中看到某一物体的颜色并不是这个物体真正拥有的颜色&#xff0c;而是它所反射的(Reflected)颜色。物体的颜色为物体从一个光源反射各个颜色分量的大小。 创建光照场景 首先需要创建一个光源&#xff0c;因为我们以及有一个立方体数据&#xff0c;我们只需要进行…

LEETCODE3

法一:记忆化递归 int climbStairsRecursive(int n, int* memo) {if (n < 2) {return n;}if (memo[n] > 0) {return memo[n];}memo[n] climbStairsRecursive(n - 1, memo) climbStairsRecursive(n - 2, memo);return memo[n]; }int climbStairs(int n) {int* memo (in…

代码随想录训练营Day21:● 530.二叉搜索树的最小绝对差 ● 501.二叉搜索树中的众数 ● 236. 二叉树的最近公共祖先

530.二叉搜索树的最小绝对差 题目链接 https://leetcode.cn/problems/minimum-absolute-difference-in-bst/description/ 题目描述 思路 遇到在二叉搜索树上求什么最值&#xff0c;求差值之类的&#xff0c;都要思考一下二叉搜索树可是有序的&#xff0c;要利用好这一特点。…

Java 拦截器Interceptor详解

1、拦截器概念 先看一下web请求的流程。 &#xff08;1&#xff09;、当浏览器发送一个请求时&#xff0c;请求到达tomcat容器&#xff0c;tomcat容器会区分静态还是动态资源。 &#xff08;2&#xff09;、动态请求会先经过过滤器链filter&#xff0c;直到全部过滤完成之后&am…

MySQL 事务的原理以及长事务的预防和处置

transaction_isolation 隔离级别 读未提交 读提交 视图是在每个 SQL 语句开始执行的时候创建的 可重复读 视图是在事务启动时创建的&#xff0c;整个事务存在期间都用这个视图 串行化…

3/12/24交换排序、插入排序、选择排序、归并排序

目录 交换排序 冒泡排序 快速排序 插入排序 直接插入排序 选择排序 简单选择排序 堆排序 归并排序 各种排序的时间复杂度、空间复杂度、稳定性和复杂度 快排真题2016 选排真题2022 排序算法分为交换类排序、插入类排序、选择类排序、归并类排序。 交换排序 交换排…

Django 学习笔记(Day1)

「写在前面」 本文为千锋教育 Django 教程的学习笔记。本着自己学习、分享他人的态度&#xff0c;分享学习笔记&#xff0c;希望能对大家有所帮助。 目录 0 课程介绍 1 Django 快速入门 1.1 Django 介绍 1.2 Django 安装 1.3 创建 Django 项目 1.4 运行 Django 项目 1.5 数据迁…

Linux-gdb调试

文章目录 前言查看&#xff08;显示&#xff09;源代码 list/l运行程序run/r打断点b查看断点删除断点打开/关闭断点逐过程 逐语句查看变量常显示continuefinishuntil修改指定变量退出gdb 前言 GDB&#xff0c;即GNU调试器&#xff08;GNU Debugger&#xff09;&#xff0c;是G…

细粒度IP定位参文27(HGNN):Identifying user geolocation(2022年)

[27] F. Zhou, T. Wang, T. Zhong, and G. Trajcevski, “Identifying user geolocation with hierarchical graph neural networks and explainable fusion,” Inf. Fusion, vol. 81, pp. 1–13, 2022. (用层次图、神经网络和可解释的融合来识别用户的地理定位) 论文地址:…

QML 控件添加键盘事件

在QML中&#xff0c;可以使用Keys类型来处理键盘事件。以下是一个简单的示例&#xff0c;演示如何在QML控件中添加键盘事件&#xff1a; import QtQuick 2.12 import QtQuick.Window 2.12Window {visible: truewidth: 640height: 480title: qsTr("Hello World")Recta…

基于YOLOv8/YOLOv7/YOLOv6/YOLOv5的常见车型识别系统(Python+PySide6界面+训练代码)

摘要&#xff1a;本文深入探讨了如何应用深度学习技术开发一个先进的常见车型识别系统。该系统核心采用最新的YOLOv8算法&#xff0c;并与早期的YOLOv7、YOLOv6、YOLOv5等版本进行性能比较&#xff0c;主要评估指标包括mAP和F1 Score等。详细解析了YOLOv8的工作机制&#xff0c…

5.Java并发编程—JUC线程池架构

JUC线程池架构 在Java开发中&#xff0c;线程的创建和销毁对系统性能有一定的开销&#xff0c;需要JVM和操作系统的配合完成大量的工作。 JVM对线程的创建和销毁&#xff1a; 线程的创建需要JVM分配内存、初始化线程栈和线程上下文等资源&#xff0c;这些操作会带来一定的时间和…

【基于langchain + streamlit 完整的与文档对话RAG】

本地部署文档问答webdemo 支持 pdf支持 txt支持 doc/docx支持 源文档索引 你的点赞和收藏是我持续分享优质内容的动力哦~ 废话不多说直接看效果 准备 首先创建一个新环境&#xff08;选择性&#xff09; conda create -n chatwithdocs python3.11 conda activate chatwith…

封装的echarts子组件使用watch监听option失效的问题

项目场景&#xff1a; 我在项目里面封装了一个echarts组件&#xff0c;组件接收一个来自外部的option,然后我用了一个watch函数去监听这个option的变化&#xff0c;option变化之后&#xff0c;销毁&#xff0c;然后再新建一个charts表 碎碎念 问题如标题所示&#xff0c;这篇…

自然语言处理: 第十五章RAG(Retrieval Augmented Generation)

论文地址: [2005.11401] Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks (arxiv.org) 代码地址: 可以参考百度文心一言为例子&#xff0c;与本文代码无关 本篇文章主要是介绍Retrieval Augmented Generation下文简称RAG技术的实现原理和代码实现以及大体…

【Springboot】--如何将springboot+vue项目部署到云服务器?

目录 一、准备工作 1、购买云服务器 2、获取面板地址 二、jdk和数据库 1、安装环境 2、配置jdk环境变量 3、java版本的问题 4、添加数据库 三、前端部署 1、vue 2、创建站点 ​编辑 四、后端部署 1、application.yml 2、idea打包 3、运行jar包 4、开放端口 五、…

扩散模型基础学习

扩散模型基础学习 AIGC是什么扩散模型的发展VAEGANDDPMstable Diffusion 基于transformer架构的Diffusion模型transformer 参考 AIGC是什么 AIGC&#xff0c;全称AI generated content (人工智能生产内容)&#xff0c;是一种利用AI自动生产内容的生产方式。 其发展依赖以下三个…