【医学影像数据处理】 XML 文件格式处理汇总

xml(Extensible Markup Language,简称:XML)可扩展标记语言,是一种netconf配置文件的格式。是一种固有的分层数据格式,最自然的表示方式是解析成树状。 但是,xml这样的标签数据,是面向“机器”识别的,是不利于“人类”识别的,所以看起来会比较的麻烦。

2003年5月成立了Netconf工作组,该工作组主要是为了提出一个全新的基于XML的网络配置(NETCONF)协议而成立的。

Python内置的API:xml.etree.ElementTree 可以解析xml文件。ElementTree将整个xml文档解析成树状结构, Element就表示这个树状结构中的单节点。

官方文件地址:The ElementTree XML API

后面举例以下面这个xml的文件形式展开,这也是官方给出的一个案例。xml文档实例如下:

xml文档实例如下:

<?xml version="1.0"?>
<data id="world country"><country name="Liechtenstein"><rank>1</rank><year>2008</year><gdppc>141100</gdppc><neighbor name="Austria" direction="E"/><neighbor name="Switzerland" direction="W"/></country><country name="Singapore"><rank>4</rank><year>2011</year><gdppc>59900</gdppc><neighbor name="Malaysia" direction="N"/></country><country name="Panama"><rank>68</rank><year>2011</year><gdppc>13600</gdppc><neighbor name="Costa Rica" direction="W"/><neighbor name="Colombia" direction="E"/></country>
</data>

一、xml 数据格式

Element常用属性对应的xml格式,如下:

<tag attrib=“netmiko_inventory”>text</tag>

例:

<device_type desc="platform">cisco_ios</device_type>tag       attrib         text       tag

其中:

1、 tag:是str对象,表示xml标签,例子中的前后闭合的device_type
2、 attrib:是一个dict对象,表示xml属性,例子中的desc="platform"
3、 text:是xml数据标签包裹的内容,也是Element的内容,例子中的 cisco_ios
4、 child elements:则是xml一对标签中包含的子集,如下图,类似于country 标签中包裹的内容

举例:

import xml.etree.ElementTree as ET# 读取、解析文件,获取跟元素
tree = ET.parse('sample.xml')
root = tree.getroot()# 获取根元素的标签名称以及所有属性
# data
print('root.tag:', root.tag)
print('root.attrib:', root.attrib)# 获取text
print(root[0][1].text)

输出结果:

root.tag: data
root.attrib: {'id': 'world country'}
2008

二、查找方法

Element有很丰富的查找方法,总结如下:

  • iter(tag=None): 遍历Elementchild,可以指定tag精确查找;
  • findall(match) :查找当前元素tagpath能匹配的child节点;
  • find(match) :查找当前元素tagpath能匹配的第一个child节点;
  • get(key, default=None) :获取元素指定key对应的attrib,如果没有attrib,返回default
# 一次性获取所有名为 country 的元素、然后遍历
for country in root.findall('country'):# 获取 country 元素中的 name 属性name = country.get('name')# 寻找名为 rank 的子节点,获取其textrank = country.find('rank').text# 一次性获取所有名为 country 下 neighbor的元素、然后遍历neighbors = country.findall('neighbor')neighbor_name = []for neighbor in neighbors:n = neighbor.get('name')neighbor_name.append(n)print(name, rank, neighbor_name)

打印结果如下:

Liechtenstein 1 ['Austria', 'Switzerland']
Singapore 4 ['Malaysia']
Panama 68 ['Costa Rica', 'Colombia']

三、iter迭代器

Element使用iter迭代器可以递归地遍历它下面的所有child

# 一次性获取所有名为 country 的元素、然后遍历
for country in root.iter('country'):# 获取 country 元素中的 name 属性name = country.get('name')print(name)for rank in root.iter('rank'):# 获取 country 元素中的 name 属性rank_n = rank.textprint(rank_n)

打印结果如下:

Liechtenstein
Singapore
Panama1
4
68

四、xml数据转换成字典

xmltodict使用非常的简单,学习成本很低,可以快速的把xml格式的数据转换成字典,轻松进行数据二次加工。

代码如下:

import xmltodict, jsonwith open('sample.xml') as f:my_dict = xmltodict.parse(f.read())with open('info1.json', 'w') as f:json.dump(my_dict, f, sort_keys=False, indent=2)

打开info1.json查看,保存的内容如下:

{"data": {"@id": "world country","country": [{"@name": "Liechtenstein","rank": "1","year": "2008","gdppc": "141100","neighbor": [{"@name": "Austria","@direction": "E"},{"@name": "Switzerland","@direction": "W"}]},{"@name": "Singapore","rank": "4","year": "2011","gdppc": "59900","neighbor": {"@name": "Malaysia","@direction": "N"}},{"@name": "Panama","rank": "68","year": "2011","gdppc": "13600","neighbor": [{"@name": "Costa Rica","@direction": "W"},{"@name": "Colombia","@direction": "E"}]}]}
}

其中:

  • tagattrib都会变成字典的key,例如,上面的data、id、country、name、rank等等;
  • 但是,带有属性attribkey,会自动加入@符号,其他不会;
  • key对应的value,会变成字符串形式。

五、保存成xml

xmltodict不仅可以将xml转为字典形式,还可以将字典转成xml形式,存储到本地,如下所示:

def saveXML():import xmltodictwith open('info.xml', 'w') as f:info_dict = {'dev_info': {'device_type': 'cisco_ios','username': 'admin','password': 'cisco','ip': '192.168.47.10'}}f.write(xmltodict.unparse(info_dict, pretty=True))

保存为xml文件后,打开查看结果如下:

<?xml version="1.0" encoding="utf-8"?>
<dev_info><device_type>cisco_ios</device_type><username>admin</username><password>cisco</password><ip>192.168.47.10</ip>
</dev_info>

六、总结

前面对xml文件做了简单的学习,包括什么是xml,以及在python中怎么读取、操作和存储为xml文件。同时将机器友好的xml文件,转成对人友好的字典查看。xml确实不太好查看和解析,弄起来有些费劲啊。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/125672.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

C# Onnx 用于边缘检测的轻量级密集卷积神经网络LDC

效果 项目 代码 using Microsoft.ML.OnnxRuntime; using Microsoft.ML.OnnxRuntime.Tensors; using OpenCvSharp; using System; using System.Collections.Generic; using System.Drawing; using System.Linq; using System.Text; using System.Windows.Forms;namespace Onnx…

【HTML】HTML基础知识扫盲

1、什么是HTML&#xff1f; HTML是超文本标记语言&#xff08;Hyper Text Markup Language&#xff09;是用来描述网页的一种语言 注意&#xff1a; HTML不是编程语言&#xff0c;而是标记语言 HTML文件也可以直接称为网页&#xff0c;浏览器的作用就是读取HTML文件&#xff…

【网络协议】聊聊http协议

当我们输入www.baidu.com的时候&#xff0c;其实是先将baidu.com的域名进行DNS解析&#xff0c;转换成对应的ip地址&#xff0c;然后开始进行基于TCP构建三次握手的连接&#xff0c;目前使用的是1.1 默认是开启了keep-Alive。可以在多次请求中进行连接复用。 HTTP 请求的构建…

Bayes决策:身高与体重特征进行性别分类

代码与文件请从这里下载&#xff1a;Auorui/Pattern-recognition-programming: 模式识别编程 (github.com) 简述 分别依照身高、体重数据作为特征&#xff0c;在正态分布假设下利用最大似然法估计分布密度参数&#xff0c;建立最小错误率Bayes分类器&#xff0c;写出得到的决…

控梦术(一)之什么是清明梦

控梦术 首先&#xff0c;问大家一个问题。在梦中&#xff0c;你知道自己是在做梦吗&#xff1f;科学数据表明&#xff0c;大约23%的人在过去一个月中&#xff0c;至少有一次在梦中意识到自己正在做梦。科学家把这叫做清醒梦或者叫做清明梦。科学家说&#xff0c;每个人都能学会…

springboot的缓存和redis缓存,入门级别教程

一、springboot&#xff08;如果没有配置&#xff09;默认使用的是jvm缓存 1、Spring框架支持向应用程序透明地添加缓存。抽象的核心是将缓存应用于方法&#xff0c;从而根据缓存中可用的信息减少执行次数。缓存逻辑是透明地应用的&#xff0c;对调用者没有任何干扰。只要使用…

云计算与ai人工智能对高防cdn的发展

高防CDN&#xff08;Content Delivery Network&#xff09;作为网络安全领域的一项关键技术&#xff0c;致力于保护在线内容免受各种网络攻击&#xff0c;包括分布式拒绝服务攻击&#xff08;DDoS&#xff09;等。然而&#xff0c;随着人工智能&#xff08;AI&#xff09;和大数…

Python 中的工厂模式

工厂设计模式属于创意设计模式范畴。 创建设计模式提供了许多对象创建技术&#xff0c;从而提高了代码的可重用性和灵活性。 工厂方法是一种创建对象而不指定其具体类的方法。 它以单个父类&#xff08;抽象类或接口&#xff09;定义对象的通用结构&#xff0c;而子类提供实例…

C#__委托delegate

委托存储的是函数的引用&#xff08;把某个函数赋值给一个委托类型的变量&#xff0c;这样的话这个变量就可以当成这个函数来进行使用了&#xff09; 委托类型跟整型类型、浮点型类型一样&#xff0c;也是一种类型&#xff0c;是一种存储函数引用的类型 using System.Reflec…

Linux网络基础2 -- 应用层相关

一、协议 引例&#xff1a;编写一个网络版的计算器 1.1 约定方案&#xff1a;“序列化” 和 “反序列化” 方案一&#xff1a;客户端发送形如“11”的字符串&#xff0c;再去解析其中的数字和计算字符&#xff0c;并且设限&#xff08;如数字和运算符之间没有空格; 运算符只…

RIS辅助MIMO广播信道容量

RIS辅助MIMO广播信道容量 摘要RIS辅助的BC容量矩阵形式的泰勒展开学习舒尔补 RIS-Aided Multiple-Input Multiple-Output Broadcast Channel Capacity论文阅读记录 基于泰勒展开求解了上行容量和最差用户的可达速率&#xff0c;学习其中的展开方法。 摘要 Scalable algorithm…

什么是神经网络,它的原理是啥?(1)

参考&#xff1a;https://www.youtube.com/watch?vmlk0rddP3L4&listPLuhqtP7jdD8CftMk831qdE8BlIteSaNzD 视频1&#xff1a; 简单介绍神经网络的基本概念&#xff0c;以及一个训练好的神经网络是怎么使用的 分类算法中&#xff0c;神经网络在训练过程中会学习输入的 pat…

Pmdarima实现单变量时序预测与交叉验证

目录 1. pmdarima实现单变量时间序列预测 2. 时间序列交叉验证 2.1 滚动交叉验证(RollingForecastCV) 2.2 滑窗交叉验证(SildingWindowForecastCV) 1. pmdarima实现单变量时间序列预测 Pmdarima是以statsmodel和autoarima为基础、封装研发出的Python时序分析库、也是现在市…

故障诊断模型 | Maltab实现GRU门控循环单元故障诊断

文章目录 效果一览文章概述模型描述源码设计参考资料效果一览 文章概述 故障诊断模型 | Maltab实现GRU门控循环单元故障诊断 模型描述 利用各种检查和测试方法,发现系统和设备是否存在故障的过程是故障检测;而进一步确定故障所在大致部位的过程是故障定位。故障检测和故障定位…

3ds Max2022安装教程(最新最详细)

目录 一.简介 二.安装步骤 网盘资源见文末 一.简介 3DS Max是由Autodesk公司开发的一款专业三维建模、动画和渲染软件&#xff0c;广泛应用于影视、游戏、建筑和工业设计等领域。 3DS Max的主要特点和功能包括&#xff1a; 三维建模&#xff1a;3DS Max提供了各种强大的建…

如何用思维导图开会

在办公室和会议室使用思维导图会有无数好处。今天我们就聊聊思维导图在开会中的作用&#xff1f; 为什么要在会议中使用思维导图&#xff1f; 思维导图可以帮助我们整理思路。会议通常涉及到复杂的议题和讨论&#xff0c;使用思维导图可以帮助整合和梳理参与者的思路和观点。通…

Vue项目搭建及使用vue-cli创建项目、创建登录页面、与后台进行交互,以及安装和使用axios、qs和vue-axios

目录 1. 搭建项目 1.1 使用vue-cli创建项目 1.2 通过npm安装element-ui 1.3 导入组件 2 创建登录页面 2.1 创建登录组件 2.2 引入css&#xff08;css.txt&#xff09; 2.3 配置路由 2.5 运行效果 3. 后台交互 3.1 引入axios 3.2 axios/qs/vue-axios安装与使用 3.2…

priority_queue 的模拟实现

priority_queue 的底层结构 我们已经学习过栈和队列了&#xff0c;他们都是用一种容器适配出来的。今天我们要学习的 prority_queue 也是一个容器适配器。在 priority_queue 的使用部分我们已经知道想要适配出 priority_queue&#xff0c;这个底层的容器必须有以下接口&#x…

安装Python环境

Python 安装包下载地址&#xff1a;https://www.python.org/downloads/ 打开该链接&#xff0c;可以看到有两个版本的 Python&#xff0c;分别是 Python 3.x 和 Python 2.x&#xff0c;如下图所示&#xff1a; Python下载页面截图 图 1 Python 下载页面截图&#xff08;包含…

【数值计算方法】Gauss消元法及其Python/C实现

文章目录 一、基础理论1. 线性方程组2. Gauss消元法的详细步骤3. 注意事项 二、具体计算过程1. 用Gauss 消元法求A的LU分解&#xff0c;并由此求解方程组 Ax ba. 将A进行LU分解。b. 使用LU分解求解方程组Axb 三、代码实现1. Python代码实现2. C语言代码实现 Gauss消元法&#x…