python—如何提取word中指定内容

        假设有一个Word,该Word中存在 “联系人” 关键字,如何将该Word中的联系人所对应的内容提取出来呢?  该Word内容如下所示:       

      
        要在给定的Word文档中提取出与"联系人"关键字对应的内容,可以使用Python的python-docx库。以下是一个示例:

import docx# 加载Word文档
doc = docx.Document('your_document.docx')# 存储提取的内容
contacts = []# 遍历文档中的段落并提取联系人关键字对应的内容
for paragraph in doc.paragraphs:if '联系人' in paragraph.text:# 获取关键字后面的内容contact = paragraph.text.split('联系人', 1)[1]contacts.append(contact.strip())# 显示提取的内容
for contact in contacts:print(contact)

        在上面的代码中,将'your_document.docx'替换为你要读取的Word文档的文件名或路径。

        运行代码后,将会显示与"联系人"关键字对应的内容。请注意,在提取"联系人"关键字的内容时,假设该关键字后面的内容是需要提取的信息。如果情况不符合,可能需要根据具体的Word文档结构和需求进行调整。

        确保已经安装了python-docx库。如果尚未安装,可以使用以下命令进行安装:

pip install python-docx
        通过以上步骤,你就可以在Python中成功提取Word文档中与"联系人"关键字对应的内容了。

运行上述代码得到运行结果为:

联系人:张三
联系人:李四
联系人:王五

 若想同时获取联系人及对应的电话,则在遍历部分代码中添加 '电话' 关键字即可,如下所示:

# 遍历文档中的段落并提取指定内容
for paragraph in doc.paragraphs:if '联系人' in paragraph.text:target_content.append(paragraph.text)elif '电话' in paragraph.text:target_content.append(paragraph.text)

添加之后程序运行结果: 

联系人:张三
电话:153***55899
联系人:李四
电话:139***08783
联系人:王五
电话:139***52328

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/99717.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【分享】xpath的属性表达式

在XPath中,要选择HTML文档中具有特定类的元素,您通常需要使用属性选择器 [attribute-nameattribute-value] 来选择元素,其中 attribute-name 是属性名称,attribute-value 是要匹配的属性值。对于HTML元素的类选择器,您…

【抓包https请求网络异常/无数据怎么破】

当你测试App的时候,想要通过Fiddler/Charles等工具抓包看下https请求的数据情况,发现大部分的App都提示网络异常/无数据等等信息。 当你测试App的时候,想要通过Fiddler/Charles等工具抓包看下https请求的数据情况,发现大部分的Ap…

见微知著:从企业售后技术支持看云计算发展

作者:余凯 售后业务中的细微变化 作为阿里云企业容器技术支持的一员,每天会面对全球各地企业级客户提出的关于容器的各种问题,通过这几年的技术支持的经历,逐步发现容器问题客户的一些惯性,哪些是重度用户&#xff0…

mysql改造oracle,以及项目改造

mysql改造oracle,以及springboot项目改造 oracle改造说明 这次的任务是springboot mysql版本改造为oracle版本,mysql5.7,oracle11.2,springboot2.0.2(springboot版本无所谓,都差不多,自己记录…

Dockerfile定制Ubuntu的docker镜像

当我们本地有一个从docker官网拉取的ubuntu:latest的Ubuntu镜像,我们基于这个镜像来定制一个自己的Ubuntu镜像 创建一个单独的文件夹create_docker 在这个文件夹下创建一个名为Dockerfile的文件:touch Dockerfile 将下面文件复制到Dockerfile文件中,可添加自己需要的安装指令…

go中bson的基本操作,bson.M,bson.D,bson.A,bson.E

1.Bson的类型 bson对象是键值对对象,bson是JSON的二进制格式。go操作mongoDB数据库的时候经常使用bson键值对作为筛选条件。 D家族,可以简单的构建BSON对象。 D:一个BSON文档,这种类型应该在顺序重要的情况下使用。 每一对键值…

Java使用模板导出word、pdf

使用deepoove根据模板导出word文档&#xff0c;包括文本、表格、图表、图片&#xff0c;使用WordConvertPdf可将word文档转换为pdf导出 模板样例&#xff1a; 导出结果&#xff1a; 一、引入相关依赖 <!-- 工具类--><dependency><groupId>cn.hutool&…

基于YOLOv5、YOLOv8的火灾检测(超实用毕业设计项目)

yolo系列文章目录 摘要&#xff1a;基于YOLOV5模型的火灾检测系统用于日常生活中检测与定位火灾目标&#xff0c;包括建筑火灾、森林火灾等。利用深度学习算法可实现图片、视频、摄像头等方式的火灾目标检测&#xff0c;另外本系统还支持图片、视频等格式的结果可视化与结果导…

基于数学模型水动力模拟、水质建模、复杂河网构建技术在环境影响评价、排污口论证及防洪评价中的实践技术应用

目录 专题一 一维水动力模型在河流水动力模拟中的应用 专题二 一维复杂河网模型构建及建筑物设置 专题三 一维水质模型在入河排污口和环境影响评价中的应用 专题四 平面二维水动力模型的构建和验证 专题五 平面二维水动力模型在防洪影响评价中的应用 专题六 平面二维水动…

RedissonClient中Stream流的简单使用

1、pub端 //获取一个流 RStream rStream redissonClient.getStream("testStream"); //创建一个map&#xff0c;添加数据 Map<String, Object> rr new HashMap<>(); rr.put("xx", RandomUtil.randomString(5)); //添加到流 rStream.addAll(r…

API攻防-接口安全SOAPOpenAPIRESTful分类特征导入项目联动检测

文章目录 概述什么是接口&#xff1f; 1、API分类特征SOAP - WSDLWeb services 三种基本元素&#xff1a; OpenApi - Swagger UISpringboot Actuator 2、API检测流程Method&#xff1a;请求方法URL&#xff1a;唯一资源定位符Params&#xff1a;请求参数Authorization&#xff…

JVM篇---第四篇

系列文章目录 文章目录 系列文章目录一、描述一下JVM加载class文件的原理机制?二、说说Java对象创建过程三、知道类的生命周期吗?一、描述一下JVM加载class文件的原理机制? JVM中类的装载是由类加载器(ClassLoader)和它的子类来实现的,Java中的类加载器是一个重要 的Jav…

日常学习记录随笔-大数据之日志(hadoop)收集实战

数据收集(nginx)--->数据分析---> 数据清洗--->数据聚合计算---数据展示 可能涉及到zabix 做任务调度我们的项目 电商日志分析 比如说我们现在有一个系统,我们的数仓建立也要有一个主题 我这个项目是什么我要干什么定义方向 对用户进行分析,用户信息 要懂整个数据的流…

三十、【进阶】B树的演变过程

1、索引结构 &#xff08;1&#xff09;二叉树 &#xff08;2&#xff09;B-Tree树 B-Tree树最大度数为5&#xff0c;代表每一个节点最多存储4个key(每个节点最多存储4个数据)&#xff0c;5个指针(可以指向5个子节点)。 2、演变过程&#xff08;最大度数为5&#xff09; &…

基于Spring Boot的网上租贸系统设计与实现(源码+lw+部署文档+讲解等)

文章目录 前言具体实现截图论文参考详细视频演示代码参考源码获取 前言 &#x1f497;博主介绍&#xff1a;✌全网粉丝10W,CSDN特邀作者、博客专家、CSDN新星计划导师、全栈领域优质创作者&#xff0c;博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技…

请问耳机降噪是如何实现的编程零碎知识就业指导词汇积累

目录 请问耳机降噪是如何实现的 编程零碎知识 就业指导 词汇积累 自杀率前五国家 请问耳机降噪是如何实现的 耳机降噪&#xff08;Noise-Cancelling Headphones&#xff09;是一种通过使用先进的技术来减少或消除外部环境噪音&#xff0c;以提供更清晰、更安静的音频体验的…

保研经历分享(一)

这个系列的文章主要是想记录一下自己大学期间最重要的一件事&#xff08;保研!!&#xff09;的经历、过程&#xff0c;外加一些保研流程介绍、面试经验、院校投递、踩坑经历&#xff0c;主要给学弟学妹们避雷&#xff0c;也做一些借鉴吧~ 这一篇主要是对保研过程的一些介绍&…

注意分类讨论完整性:CF1371F

https://www.luogu.com.cn/problem/CF1371F 此题要分类讨论完全 容易漏掉 >>>>><<<<< 在左右或中间的情况 多对拍 #include<bits/stdc.h> using namespace std; //#define int long long inline int read(){int x0,f1;char chgetchar(…

redis集群某主节点宕机,其从节点未自动接管(故障转移未生效)问题解决

故障转移未生效可能有很多种原因&#xff0c;这里只记录本次排查原因&#xff1a; redis集群模式 三主三从 过程&#xff1a;初始集群可以正常启动&#xff0c;想模拟故障转移情况&#xff0c;手动kill某主节点的端口进程&#xff0c;集群状态就为fail了&#xff0c;其从节点…

全志R128芯片应用开发案例——驱动 WS2812 流水灯

驱动 WS2812 流水灯 本文案例代码下载地址驱动 WS2812 流水灯案例代码https://www.aw-ol.com/downloads?cat24 R128-DevKit 拥有4颗 WS2812 LED&#xff0c;本文将详细叙述如何点亮他们。 LEDC 模块简介 LEDC 硬件方框图如上图所示&#xff0c;CPU 通过 APB 总线操作 LEDC 寄…