格式转换 ▏Python 实现Word转HTML

将Word转换为HTML能将文档内容发布在网页上,这样,用户就可以通过浏览器直接查看或阅读文档而无需安装特定的软件。Word转HTML对于在线发布信息、创建在线文档库以及构建交互式网页应用程序都非常有用。以下是PythonWord转换为HTML网页的攻略,包含两个示

目录

Python Word库安装

用Python 将Word Doc/Docx转为HTML格式

用Python 将Word转为HTML并嵌入CSS样式、图片等


Python Word库安装

在进行该转换操作前,需要先安装Spire.Doc for Python库。它是一款专业的Python Word 开发组件轻松实现 Word 文档的创建、读取、编辑和转换等功能

产品安装pip 命令:

pip install Spire.Doc

详细安装教程可参考: 如何在 VS Code中安装 Spire.XLS for Python

Python Word Doc/Docx转为HTML格式

第一个示例是一个特别简单的转换方法,仅需加载一个 .doc或 .docx文档,然后使用Document.SaveToFile(fileName string, FileFormat.Html) 方法就能将Word文档另存为HTML格式。代码如下:

from spire.doc import *
from spire.doc.common import *# 创建Document对象
document = Document()# 加载一个doc或docx文档 
document.LoadFromFile("财务报告.docx")# 保存为HTML文件
document.SaveToFile("Word转Html.html", FileFormat.Html)
document.Close()

生成文件效果图:

Python Word转为HTML并嵌入CSS样式、图片等

如果在转换时想要嵌入特定的CSS样式,如内部样式 Internal外部样式 External,或者需要嵌入图片等,可以用Spire.Doc for Python 提供的 HtmlExportOptions 类。代码如下:

from spire.doc import *
from spire.doc.common import *# 创建Document对象
document = Document()# 加载Word文档
document.LoadFromFile("财务报告.docx")# 嵌入CSS样式
document.HtmlExportOptions.CssStyleSheetFileName = "sample.css"
document.HtmlExportOptions.CssStyleSheetType = CssStyleSheetType.External# 设置是否嵌入图像
document.HtmlExportOptions.ImageEmbedded = False
document.HtmlExportOptions.ImagesPath = "Images/"# 设置是否将表单字段导出为纯文本
document.HtmlExportOptions.IsTextInputFormFieldAsText = True# 将文档保存为 html 文件
document.SaveToFile("转Html.html", FileFormat.Html)
document.Close()

此外HtmlExportOptions 类还提供了一些别的属性来设置Word到HTML导出选项,具体查看HtmlExportOptions Class

了解Spire.Doc for Python的更多功能:Spire.Doc for Python 中文教程

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/103429.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

10月13日上课内容 Ansible 的脚本 --- playbook 剧本

playbooks 本身由以下各部分组成 (1)Tasks:任务,即通过 task 调用 ansible 的模板将多个操作组织在一个 playbook 中运行 (2)Variables:变量 (3)Templates:模…

Vue封装组件并发布到npm仓库

前言 使用Vue框架进行开发,组件封装是一个很常规的操作。一个封装好的组件可以在项目的任意地方使用,甚至我们可以直接从npm仓库下载别人封装好的组件来进行使用,比如iview、element-ui这一类的组件库。但是每个公司的业务场景可能不同&…

使用css 与 js 两种方式实现导航栏吸顶效果

position的属性我们一般认为有 position:absolute postion: relative position:static position:fixed position:inherit; position:initial; position:unset; 但是我最近发现了一个定位position:sticky 这个可以称为粘性定位。 这个粘性定位的元素会始终在那个位置 <st…

【网络编程】Linux网络编程基础与实战第一弹——网络基础

这里写目录标题 网络基础什么是协议典型协议 分层模型OSI七层模型TCP/IP四层模型 网络应用程序设计模式优缺点具体体现&#xff1a; 网络基础 什么是协议 从应用的角度出发&#xff0c;协议可理解为“一组规则”&#xff0c;是数据传输和数据的解释的规则。 假设&#xff0c;…

nrm,npm源的管理工具

npm手动切换淘宝源 查看当前的仓库 npm config get registry设置成淘宝源 npm config set registry https://registry.npmmirror.com/设置回官方源 npm config set registry https://registry.npmjs.org/手动切换不免不太方便&#xff0c;而且网上很多资料淘宝源还是过期的链接…

Java Spring Boot 自动装配:简化配置和提高开发效率

Spring Boot 自动装配是 Spring Boot 提供的一种特性&#xff0c;它可以根据应用程序的依赖关系和配置信息&#xff0c;自动配置应用程序的各种组件和功能。这样&#xff0c;开发者可以将更多的精力放在业务逻辑的实现上&#xff0c;而不需要手动配置和管理各种组件。 1. 自动…

webpack 3 + Vue2 使用dotenv配置多环境

提示&#xff1a;文章写完后&#xff0c;目录可以自动生成&#xff0c;如何生成可参考右边的帮助文档 文章目录 前言一、dotenv二、使用步骤1.引入库2.添加.env文件3.修改代理配置4.vue文件中如何使用环境变量 总结 前言 webpack 3 Vue2 使用dotenv方式配置多环境 一、dotenv…

使用dateutil的parser.parse()格式化时间对象

使用dateutil的parser.parse()格式化时间对象 问题背景 由三种字符串格式的时间 datetime 类型&#xff0c;t1 “2023-10-03 17:56:32”date 类型&#xff0c;t2 “2023-10-03”time 类型&#xff0c;t3 “17:56:32” 需求 想要把这三种格式的字符串转换为时间对象&…

P7929 [COCI2021-2022#1] Logičari

P7929 [COCI2021-2022#1] Logičari [P7929 COCI2021-2022#1] Logičari - 洛谷 | 计算机科学教育新生态 (luogu.com.cn) 文章目录 P7929 [COCI2021-2022#1] Logičari题目大意思路code 题目大意 给定一棵 n n n 个节点的基环树&#xff0c;现在对树上的节点染色&#xff0c…

为了方便,采用数据库连接池druid

采用数据库连接池听说效率高,想想按原理来说也是。不过对于初学者或兴趣爱好者,它最大的好处在于在各种数据库中间切换方便。开发环境可以用自己熟悉的数据库,生产环境中切换到实际要用的数据库,毕竟我们平时用的很多软件应该有版权问题,当然不用微软软件的人员没有这个困…

UE4和C++ 开发-C++与UMG的交互2(C++获取UMG的属性)

1、...C获取UMG的属性 1.1、第一种方法&#xff1a;通过名称获取控件。 void UMyUserWidget::NativeConstruct() {Super::NativeConstruct();//通过名字&#xff0c;获取蓝图控件中的按钮引用。CtnClic Cast<UButton>(GetWidgetFromName(TEXT("Button_44"))…

Hive实战(03)-深入了解Hive JDBC:在大数据世界中实现数据交互

在大数据领域&#xff0c;Hive作为一种数据仓库解决方案&#xff0c;为用户提供了一种SQL接口来查询和分析存储在Hadoop集群中的数据。为了更灵活地与Hive进行交互&#xff0c;我们可以使用Hive JDBC&#xff08;Java Database Connectivity&#xff09;驱动程序。本文将深入探…

【【萌新的SOC学习之基于BRAM的PS和PL数据交互实验】】

萌新的SOC学习之基于BRAM的PS和PL数据交互实验 基于BRAM的PS和PL的数据交互实验 先介绍 AXI BRAM IP核控制器的简介 AXI BRAM ip核 是xilinx提供的一个软核 这个ip核被设计成 AXI的一个从机接口 用于AXI互联的集成 系统的主设备和本地的RAM进行通信 &#xff08;我们可以通过这…

JS截取url上面的参数

手动截取封装 function getUrlParams(url location.href) {let urlStr url.split(?)[1] || let obj {};let paramsArr urlStr.split(&)for (let i 0, len paramsArr.length; i < len; i) {const num paramsArr[i].indexOf()let arr [paramsArr[i].substring(0,…

Docker快速上手:使用Docker部署Drupal并实现公网访问

文章目录 前言1. Docker安装Drupal2. 本地局域网访问3 . Linux 安装cpolar4. 配置Drupal公网访问地址5. 公网远程访问Drupal6. 固定Drupal 公网地址 前言 Dupal是一个强大的CMS&#xff0c;适用于各种不同的网站项目&#xff0c;从小型个人博客到大型企业级门户网站。它的学习…

“Python+”集成技术高光谱遥感数据处理与机器学习深度应用

本内容提供一套基于Python编程工具的高光谱数据处理方法和应用案例。涵盖高光谱遥感数据处理的基础、python开发基础、机器学习和应用实践。重点解释高光谱数据处理所涉及的基本概念和理论&#xff0c;在帮助深入理解科学原理。结合Python编程工具&#xff0c;专注于解决高光谱…

数据可视化实战:如何给毛*易的歌曲做词云展示?

⭐️⭐️⭐️⭐️⭐️欢迎来到我的博客⭐️⭐️⭐️⭐️⭐️ 🐴作者:秋无之地 🐴简介:CSDN爬虫、后端、大数据领域创作者。目前从事python爬虫、后端和大数据等相关工作,主要擅长领域有:爬虫、后端、大数据开发、数据分析等。 🐴欢迎小伙伴们点赞👍🏻、收藏⭐️、…

Springcloud笔记(4)-客户端负载均衡Ribbon

Ribbon是一个基于HTTP和TCP的客户端负载均衡工具&#xff0c;不需要独立部署&#xff0c;几乎存在于每一个springcloud构建的微服务和基础设施中。 微服务间调用&#xff0c;API网关的请求转发都通过Ribbon实现。 负载均衡 通常所说的负载均衡都是指的服务端负载均衡&#xf…

离散型制造企业MES管理系统解决方案

随着制造业的快速发展&#xff0c;离散型制造企业面临着越来越多的挑战。多样性、生产批次、工序复杂性以及高度定制化等特点使得企业的生产管理变得越来越复杂。为了提高生产效率和管理效率&#xff0c;许多企业开始寻求合适的解决方案。本文将以离散型制造企业的特点为基础&a…

铁道交通运输运营3D模拟仿真实操提供一个沉浸、高效且环保的情境

VR模拟果蔬运输应急处理场景在农产品物流行业中具有重要的意义。这种模拟技术为农产品运输提供了全新的、更高效和更安全的方式来模拟真实世界的应急情况&#xff0c;帮助操作人员、研究者和管理者更好地理解和应对可能的运输风险措施。 VR模拟果蔬运输应急处理场景可以模拟出各…