python:xml.etree 生成思维导图 Freemind文件

请参阅:java : pdfbox 读取 PDF文件内书签 或者 python:从PDF中提取目录

请注意:书的目录.txt 编码:UTF-8,推荐用 Notepad++ 转换编码。

xml 是 python 标准库,在 D:\Python39\Lib\xml\etree

python 用 xml.etree.ElementTree 生成思维导图 Freemind(.mm)文件

编辑 txt_xml_etree_mm.py  如下

# -*- coding: utf-8 -*-
""" 读目录.txt文件,使用 xml.etree 生成思维导图 Freemind(.mm)文件"""
import os
import sys
import codecs
import xml.etree.ElementTree as etif len(sys.argv) ==2:f1 = sys.argv[1]
else:print('usage: txt_xml_etree_mm.py  file1.txt')sys.exit(1)if not os.path.exists(f1):print(f"ERROR: {f1} not found.")sys.exit(1)fn,ext = os.path.splitext(f1)
if ext.lower() != '.txt':print('ext is not .txt')sys.exit(2)# 创建根节点
map1 = et.Element("map")
map1.set('version', '1.0.1')fp = codecs.open(f1, mode="r", encoding="utf-8")
# 读取第一行:书名
title = fp.readline()
# 创建主题节点
root = et.SubElement(map1, "node")
root.set('ID', '1')
root.set('STYLE', 'bubble') # 泡框
root.set('TEXT', title.strip())# 定义连线的颜色:红色
edge = et.SubElement(root, "edge")
edge.set('COLOR', "#ff0000")# 用缩排表现层级关系,假设最多5个层级
indent1 = ' '*2
indent2 = ' '*4
indent3 = ' '*6
indent4 = ' '*8n = 2
for line in fp:txt = line.strip()if len(txt) ==0:continuetxt = txt[0:-3] # 去掉行尾的页数if len(txt) >0 and line[0] !=' ':# 创建主题的子节点(1级节点)node1 = et.SubElement(root, "node")node1.set('ID', str(n))node1.set('POSITION', "right")node1.set('TEXT', txt)p_node = node1 # 寄存父节点elif line.startswith(indent1) and line[2] !=' ':# 创建node1的子节点(2级节点)try: type(node1)except NameError: node2 = et.SubElement(root, "node")else: node2 = et.SubElement(node1, "node")node2.set('ID', str(n))node2.set('TEXT', txt)p_node = node2elif line.startswith(indent2) and line[4] !=' ':# 创建node2的子节点(3级节点)try: type(node2)except NameError: node3 = et.SubElement(node1, "node")else: node3 = et.SubElement(node2, "node")node3.set('FLODED', "true")node3.set('ID', str(n))node3.set('TEXT', txt)p_node = node3elif line.startswith(indent3) and line[6] !=' ':# 创建node3的子节点(4级节点)try: type(node3)except NameError: node4 = et.SubElement(node2, "node")else: node4 = et.SubElement(node3, "node")node4.set('ID', str(n))node4.set('TEXT', txt)p_node = node4elif line.startswith(indent4) and line[8] !=' ':# 创建node4的子节点(5级节点)try: type(node4)except NameError: node5 = et.SubElement(p_node, "node")else: node5 = et.SubElement(node4, "node")node5.set('ID', str(n))node5.set('TEXT', txt)else:print(txt)n += 1
fp.close()# 转换成 str,方便导出
map_bytes = et.tostring(map1, encoding="utf-8")# 导出到 .mm 格式的文件中
f2 = fn +'.mm'
with open(f2, 'w+b') as fp:fp.write(map_bytes)print(f"line number: {n}")

运行 python txt_xml_etree_mm.py  your_pdf_dir.txt

生成 your_pdf_dir.mm

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/678866.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Java图形化界面编程——弹球游戏 笔记

Java也可用于开发一些动画。所谓动画,就是间隔一定的时间(通常小于0 . 1秒 )重新绘制新的图像,两次绘制的图像之间差异较小,肉眼看起来就成了所谓的动画 。 ​ 为了实现间隔一定的时间就重新调用组件的 repaint()方法,可以借助于…

图像的旋转不变特性及应用

想象一下,你有一张印着某个明显标志的纸张,例如一个黑色的字母 “X”。你将这张纸放在桌子上,用相机拍下了一张照片。然后,你将纸张顺时针旋转45度,并再次拍照。尽管纸张的方向变了,但上面的 “X” 还是那个…

js文件忽略ESLint语法检查

1. 整个文件忽略 /* eslint-disable */ // 代码开始位置2. 临时禁止 /* eslint-disable */ console.log(hello); /* eslint-enable */3. 对指定规则忽略 /* eslint-disable no-alert, no-console */ alert(foo); console.log(bar); /* eslint-enable no-alert, no-console …

C++ 贪心 区间问题 区间分组

给定 N 个闭区间 [ai,bi] ,请你将这些区间分成若干组,使得每组内部的区间两两之间(包括端点)没有交集,并使得组数尽可能小。 输出最小组数。 输入格式 第一行包含整数 N ,表示区间数。 接下来 N 行&…

共享锁与独占锁的区别与死锁的预防

共享锁与独占锁的区别与死锁的预防 在数据库管理系统中,锁是一种重要的资源管理机制,用于控制对共享资源的访问。其中,共享锁和独占锁是两种基本的锁类型,它们在并发控制中扮演着重要的角色。本文将深入探讨共享锁与独占锁的区别…

记录 | C++ std::cout 二进制<< 没有找到可接受“std::string“类型的右操作数的运算符(或没有可接受的转换)

error C2679: 二进制“<<”: 没有找到接受“std::string”类型的右操作数的运算符(或没有可接受的转换) 【解决办法】 添加头文件 <string> 而在之前没有碰到过类似的问题&#xff0c;找了下问题突然发现是因为头文件的加载错误&#xff0c;加载<string>就编…

Linux cp命令注意事项

目录 一. 基本语法二. 文件复制到文件夹时的路径存在问题三. 文件复制到文件夹时&#xff0c;记得给文件夹路径加上/ 一. 基本语法 -r&#xff1a;递归地复制目录及其内容。-p&#xff1a;保留源文件或目录的属性&#xff08;包括权限、所有者、组、时间戳等&#xff09;。 c…

边缘计算的重要性与应用场景

今天&#xff0c;我们探讨边缘计算的重要性与应用场景。 随着数字化时代的到来&#xff0c;数据已经成为我们生活中不可或缺的元素。然而&#xff0c;随着数据量的不断增长&#xff0c;传统的云计算已经难以满足我们的需求。边缘计算的出现&#xff0c;为我们提供了一种新的解…

设计模式--桥接模式(Bridge Pattern)

桥接模式&#xff08;Bridge Pattern&#xff09;是一种结构型设计模式&#xff0c;它主要是用于将抽象部分与实现部分分离&#xff0c;使它们可以独立地变化。 桥接模式主要包含以下几个角色&#xff1a; Abstraction&#xff08;抽象类&#xff09;&#xff1a;定义抽象类的…

Hugging Face 刚刚推出了一款开源的 AI 助手制造工具,直接向 OpenAI 的定制 GPT 挑战

每周跟踪AI热点新闻动向和震撼发展 想要探索生成式人工智能的前沿进展吗&#xff1f;订阅我们的简报&#xff0c;深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同&#xff0c;从行业内部的深度分析和实用指南中受益。不要错过这个机会&#xff0c;成为AI领…

Linux——动静态库

基础知识:动vs静 类型动静加载时机运行时编译时可复用性多个文件只需要加载一份库文件每个文件都需要加载一份文件性能链接次数越多越有优势链接次数越少越有优势 代码编写 静态库 生成静态库 libmath.a:add.o sub.oar -rc $ $^%.o:%.cgcc -c $<使用静态库 头文件和工…

《动手学深度学习(PyTorch版)》笔记8.6

注&#xff1a;书中对代码的讲解并不详细&#xff0c;本文对很多细节做了详细注释。另外&#xff0c;书上的源代码是在Jupyter Notebook上运行的&#xff0c;较为分散&#xff0c;本文将代码集中起来&#xff0c;并加以完善&#xff0c;全部用vscode在python 3.9.18下测试通过&…

vue3学习——路由进度条

安装 pnpm i nprogress创建permission.ts import router from /router/index.ts import NProgress from nprogress import nprogress/nprogress.css // 不加样式不显示 NProgress.configure({ showSpinner: false }) router.beforeEach((to, from, next) > {console.log(t…

HTTP与HTTPS:网络安全之门户

源码分享 ​​https://docs.qq.com/sheet/DUHNQdlRUVUp5Vll2?tabBB08J2​​ 在进行网页爬取和数据收集时&#xff0c;我们经常会与HTTP&#xff08;超文本传输协议&#xff09;和HTTPS&#xff08;安全的超文本传输协议&#xff09;打交道。这两种协议都用于互联网上的数据传…

数据结构(2) 线性表

线性表 线性表的定义线性表的基本操作lnitList(&L)DestroyList(&L)Listlnsert(&L,i,e)ListDelete(&L,i,&e)LocateElem(L,e)GetElem(L,i)Length(L)PrintList(L)Empty(L)Tips:引用值 小结 根据数据结构的三要素–逻辑结构、数据的运算、存储结构&#xff0c;…

TDL - medium synopsis: 厦大易中天教授:鲁迅与先秦诸子

Medium Synopsis on Chinese authentic culture I) website addressII) Excerpts&#xff0c; notes and Quotation I) website address url resource II) Excerpts&#xff0c; notes and Quotation 文学&#xff0c;艺术&#xff0c;美学&#xff0c;心理学&#xff0c;人…

GeoServer 2.11.1升级解决Eclipse Jetty 的一系列安全漏洞问题

Eclipse Jetty 资源管理错误漏洞(CVE-2021-28165) Eclipse Jetty HTTP请求走私漏洞(CVE-2017-7656) Eclipse Jetty HTTP请求走私漏洞(CVE-2017-7657) Eclipse Jetty HTTP请求走私漏洞(CVE-2017-7658) Jetty 信息泄露漏洞(CVE-2017-9735) Eclipse Jetty 安全漏洞(CVE-2022-20…

LeetCode374. Guess Number Higher or Lower——二分查找

文章目录 一、题目二、题解 一、题目 We are playing the Guess Game. The game is as follows: I pick a number from 1 to n. You have to guess which number I picked. Every time you guess wrong, I will tell you whether the number I picked is higher or lower th…

Javaweb之SpringBootWeb案例之事务进阶的详细解析

1.3 事务进阶 前面我们通过spring事务管理注解Transactional已经控制了业务层方法的事务。接下来我们要来详细的介绍一下Transactional事务管理注解的使用细节。我们这里主要介绍Transactional注解当中的两个常见的属性&#xff1a; 异常回滚的属性&#xff1a;rollbackFor 事…

项目02《游戏-14-开发》Unity3D

基于 项目02《游戏-13-开发》Unity3D &#xff0c; 任务&#xff1a;战斗系统之击败怪物与怪物UI血条信息 using UnityEngine; public abstract class Living : MonoBehaviour{ protected float hp; protected float attack; protected float define; …