前言
本文是该专栏的第4篇,后面会持续分享Python办公自动化干货知识,记得关注。
在本专栏上一篇文章《Python实现对Word文档内容出现“重复标题”进行自动去重(3)》中,笔者有详细介绍使用python对word文档内容的目标文本进行自动去重。只不过本文要介绍的“去重方法”与上篇介绍的点不一样,在上一篇文章中,笔者介绍的是“精准去重”。
而本文要介绍的方法,是“将正文标题重复的行,以及标题到该行之间的内容,全部删除”。如下图所示:
当我们的目标word文本内容中,出现与标题一样的内容,想要通过python实现将重复标题与标题之间的数据都删除,需要怎么做呢?
解决方法,跟着笔者直接往下看正文详细内容。(附完整代码)
正文
需求<