39.Python从入门到精通—parseString 方法 Python 解析XML实例 使用xml.dom解析xml

39.Python从入门到精通—parseString 方法 Python 解析XML实例 使用xml.dom解析xml

    • parseString 方法
    • Python 解析XML实例
    • 使用xml.dom解析xml

parseString 方法

parseString 方法是 Python 标准库中 xml.dom.minidom 模块中的一个函数,用于解析 XML 字符串并构建 DOM 树。它的语法如下:

xml.dom.minidom.parseString(xmlstring)

其中,xmlstring 是要解析的 XML 字符串。 使用 parseString 方法可以将 XML 字符串解析为一个 DOM树,然后可以使用 DOM 树提供的方法对 XML 文档进行遍历和操作。

以下是一个使用 parseString 方法解析 XML 字符串的简单示例:

import xml.dom.minidomxmlstring = '<person><name>Alice</name><age>18</age></person>'
# 解析 XML 字符串
dom = xml.dom.minidom.parseString(xmlstring)
# 获取根节点
root = dom.documentElement
# 获取子节点
name = root.getElementsByTagName('name')[0]
age = root.getElementsByTagName('age')[0]
# 获取节点的文本内容
name_text = name.firstChild.data
age_text = age.firstChild.data
print(name_text, age_text)
  • 在这个示例中,我们使用 parseString 方法解析了一个 XML 字符串,并获取了根节点和子节点。然后我们使getElementsByTagName 方法获取指定标签名的节点,并使用 firstChild.data获取节点的文本内容。最后,我们输出了节点的文本内容。

需要注意的是,使用 parseString 方法解析 XML 字符串时,如果 XML 字符串格式不正确,会抛出异常。此外,使用 minidom 解析大型 XML 文档时可能会导致性能问题。

Python 解析XML实例

以下是一个使用 Python 解析 XML 的实例,其中使用了 ElementTree 解析库:

XML 文件内容(example.xml):
<?xml version="1.0" encoding="UTF-8"?>
<bookstore><book category="COOKING"><title lang="en">Everyday Italian</title><author>Giada De Laurentiis</author><year>2005</year><price>30.00</price></book><book category="CHILDREN"><title lang="en">Harry Potter</title><author>J.K. Rowling</author><year>2005</year><price>29.99</price></book><book category="WEB"><title lang="en">Learning XML</title><author>Erik T. Ray</author><year>2003</year><price>39.95</price></book>
</bookstore>

Python 代码:

import xml.etree.ElementTree as ET# 解析 XML 文件
tree = ET.parse('example.xml')# 获取根节点
root = tree.getroot()# 遍历子节点
for child in root:print(child.tag, child.attrib)# 获取指定节点
book = root.find(".//book[@category='WEB']")
title = book.find('title').text
author = book.find('author').text
year = book.find('year').text
price = book.find('price').text
print(title, author, year, price)# 使用 XPath 查询
books = root.findall(".//book[price < 30]")
for book in books:title = book.find('title').textauthor = book.find('author').textyear = book.find('year').textprice = book.find('price').textprint(title, author, year, price)输出结果:
book {'category': 'COOKING'}
book {'category': 'CHILDREN'}
book {'category': 'WEB'}
Learning XML Erik T. Ray 2003 39.95
Everyday Italian Giada De Laurentiis 2005 30.00

在这个示例中,我们使用 ElementTree 解析库解析了一个 XML 文件,并使用 getroot() 方法获取了根节点。然后我们使用
for 循环遍历根节点的所有子节点,并输出节点的标签和属性。接着我们使用 find() 方法获取指定节点的文本内容。最后,我们使用
XPath 查询获取所有价格小于 30 的书籍,并输出书籍的信息。

使用xml.dom解析xml

在 Python 中,解析 XML 文件的另一种常用方法是使用 xml.dom 模块中的 minidom 类。该类提供了一种基于 DOM(Document Object Model)的解析方式,将整个 XML 文件加载到内存中,并将其表示为一个树形结构。
以下是一个示例代码:

import xml.dom.minidom# 解析 XML 文件
dom = xml.dom.minidom.parse('example.xml')
# 获取根元素
root = dom.documentElement
# 遍历 XML 文件
for child in root.childNodes:if child.nodeType == child.ELEMENT_NODE:print(child.tagName, child.attributes.items())for subchild in child.childNodes:if subchild.nodeType == subchild.ELEMENT_NODE:print(subchild.tagName, subchild.firstChild.nodeValue)
  • 在这个例子中,我们首先使用 xml.dom.minidom.parse() 方法解析名为 example.xml 的 XML文件,并将返回的 Document 对象存储在变量 dom 中。然后,我们使用dom.documentElement 方法获取 XML文件的根元素,并将其存储在变量 root 中。
  • 接下来,我们使用 childNodes 属性遍历根元素的子元素,并使用 nodeType属性判断节点类型是否为元素节点。如果是元素节点,我们就使用 tagName 属性获取元素的标签名,使用
    attributes.items() 方法获取元素的属性,并打印它们。然后,我们再次使用 childNodes属性遍历每个子元素的子元素,并使用 nodeType 属性判断节点类型是否为元素节点。如果是元素节点,我们就使用 tagName属性获取元素的标签名,使用 firstChild.nodeValue 属性获取元素的文本内容,并打印它们。
  • 需要注意的是,在使用 xml.dom.minidom 模块解析 XML 文件时,需要将整个 XML 文件加载到内存中,因此对于较大的XML 文件可能会导致性能问题。此外,使用 childNodes 属性和 nodeType 属性遍历 XML元素也比较繁琐,需要进行多次判断和类型转换。

总的来说,使用 xml.dom.minidom 模块解析 XML 文件可以提供一种基于 DOM 的解析方式,适用于小型的 XML 文件和简单的 XML 结构。对于更复杂的 XML 文件和结构,可能需要使用其他方法或库来解析和操作它们。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/802603.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

乳腺癌诊断的集成自注意力Transformer编码器

ETECADx: Ensemble Self-Attention Transformer Encoder for Breast Cancer Diagnosis Using Full-Field Digital X-ray Breast Images 内科医生和放射科医生建议使用多种方法来发现乳腺癌&#xff0c;包括数字乳房x线摄影(DM)、超声(US)和磁共振成像(MRI)。 CAD系统与乳腺x线…

深度学习【向量化(array)】

为什么要向量化 在深度学习安全领域、深度学习练习中&#xff0c;你经常发现在训练大量数据时&#xff0c;深度学习算法表现才更加优越&#xff0c;所以你的代码运行的非常快至关重要&#xff0c;否则&#xff0c;你将要等待非常长的时间去得到结果。所以在深度学习领域向量化…

java中使用雪花算法(Snowflake)为分布式系统生成全局唯一ID

&#xff08;全局唯一ID的解决方案有很多种&#xff0c;这里主要是介绍和学习Snowflake算法&#xff09; 什么是雪花算法&#xff08;Snowflake&#xff09; 雪花算法&#xff08;Snowflake Algorithm&#xff09;是由Twitter公司在2010年左右提出的一种分布式ID生成算法&…

有没有寄快递省钱的方法啊,尤其是搬家寄大件?

从大学开始离家&#xff0c;到读研&#xff0c;工作&#xff0c;辗转换了四五个城市了&#xff0c;大大小小搬家十几次&#xff0c;最近才发现有一个宝藏寄快递方法。 个人寄件贵是为什么呢&#xff1f;据我做物流的朋友说一般我们寄快递因为单量少&#xff0c;所以单件价格都…

Windows下Docker安装Kafka3+集群

编写 docker-compose.yaml 主要参照&#xff1a;https://www.cnblogs.com/wangguishe/p/17563274.html version: "3"services:kafka1:image: bitnami/kafka:3.4.1container_name: kafka1environment:- KAFKA_HEAP_OPTS-Xmx1024m -Xms1024m- KAFKA_ENABLE_KRAFTyes- K…

【一】学习TDengine-总结新技术学习的思考

学习TDengine-总结新技术学习的思考 概要 因业务场景需要我们开始接触时序数据库&#xff0c;于是开始根据以往的学习经验着手熟悉这一项新技术&#xff0c;学习也是一种技能&#xff0c;成功的人越容易成功&#xff0c;因为他们掌握了一套成功的方法&#xff0c;这里提到学习经…

windows 线程同步的四种方式总结

一&#xff1a;内核态下的三种同步方式&#xff1a; 一、互斥变量&#xff08;Mutex&#xff09; 互斥对象包含一个使用数量&#xff0c;一个线程ID和一个计数器。其中线程ID用于标识系统中的哪个线程当前拥有互斥对象&#xff0c;计数器用于指明该线程拥有互斥对象的次数。 创…

Vue的学习之旅-part5

Vue的学习之旅-part5 虚拟DOM的原理用JS模拟DOM结构 vue的方法、计算属性、过滤器computed:{} 计算属性computed计算属性的完全体computed计算属性和methods方法的区别&#xff1a;过滤器&#xff1a;filters:{ 多个方法 } Vuex 状态管理模式 前几篇博客: Vue的学习之旅-part1 …

【算法】第二篇 大衍数列

导航 1. 简介2. 数列特征3. 代码演示 1. 简介 大衍数列&#xff0c;来源于《乾坤谱》中对易传“大衍之数五十”的推论。主要用于解释中国传统文化中的太极衍生原理。数列中的每一项&#xff0c;都代表太极衍生过程中&#xff0c;曾经经历过的两仪数量总和。是中华传统文化中隐…

shell免登陆脚本

#!/bin/bash ## 脚本接收的参数&#xff0c;也就是要互相配置 SSH 免密登录的服务器列表参数 BASE_HOST_LISTip ## 密码&#xff0c;默认用户是当前运行脚本的用户&#xff0c;比如 root 用户 ## 这里改成你的用户对应的密码 BASE_PASSWORD"password" ## shell 函…

A Study of Network Forensic Investgation in Docker Environments文章翻译

A Study of Network Forensic Investgation in Docker Environments Docker环境下的网络取证研究 摘要 网络罪犯利用越来越多的技术(如虚拟机或基于容器的基础设施)进行恶意活动。 这些虚拟环境的固有动态简化了恶意服务的快速创建,并隐藏了所涉及的系统,这是以前没有的技…

Mybatis一级、二级缓存

Mybatis一级缓存 是SqlSession级别 1. 不同的sqlSession的相同查询是没有走缓存的 2. 相同的sqlSession的查询如果查询条件不同或期间进行过写操作也是不走缓存的 Mybatis二级缓存 是SqlSessionFactory级别 1.同一个SqlSeesionFactory创建的SqlSession查询结果会被缓存&#x…

c++ 对象切片

C对象切片&#xff08;Object Slicing&#xff09;是一个概念&#xff0c;指的是当派生类对象被赋值给基类对象时&#xff0c;只会复制基类部分的成员变量&#xff0c;派生类特有的成员变量将被丢弃。这可能导致数据丢失或不正确的行为。这种情况通常发生在使用值传递或赋值操作…

【考研复试上机】C++ ACM输入输出总结

输入字符串数组 此类输入一般会先在第一行输入长度n&#xff0c;再在第二行输入长度为n的数组。 数组可能会用空格隔开&#xff0c;如 3 aaa bbb cccint n; cin >> n; // 读取数组长度nstring s; cin.ignore(); // 忽略前一个输入的换行符 getline(cin, s); // 读取整…

用AI作图,使用这个免费网站,快看我画的大鹏鸟和美女

还是大剑师兰特&#xff1a;曾是美国某知名大学计算机专业研究生&#xff0c;现为航空航海领域高级前端工程师&#xff1b;CSDN知名博主&#xff0c;GIS领域优质创作者&#xff0c;深耕openlayers、leaflet、mapbox、cesium&#xff0c;canvas&#xff0c;webgl&#xff0c;ech…

GStreamer命令行工具概览

gst-device-monitor-1.0、gst-inspect-1.0、gst-play-1.0、gst-typefind-1.0、gst-discoverer-1.0、gst-launch-1.0、gst-stats-1.0 这些命令都是 GStreamer 框架的一部分&#xff0c;它是一个用于创建流媒体应用的库集合。GStreamer 提供了一个丰富的命令行工具集合&#xff0…

中科院发布大模型想象增强法IAG,无需外部资源,想想就能变强

在人工智能领域&#xff0c;尤其是自然语言处理&#xff08;NLP&#xff09;的子领域——问答系统&#xff08;QA&#xff09;中&#xff0c;知识的获取和利用一直是推动技术进步的核心问题。近年来&#xff0c;大语言模型&#xff08;LLMs&#xff09;在各种任务中展现出了惊人…

风电场智能化转型基于ARM工控机的HDMI数据实时监控显示

全球能源结构不断调整的大背景下&#xff0c;智能电网、太阳能发电、风能发电等清洁能源领域正经历着一场由技术创新引领的深刻变革。在这场变革中&#xff0c;ARM架构的工控机凭借其出色的性能、低功耗及高度可定制化的特点&#xff0c;正在成为能源管理系统的核心组件&#x…

轴向磁通电机应用场景不断扩展 未来市场存在较大开发空间

轴向磁通电机应用场景不断扩展 未来市场存在较大开发空间 根据磁通方向不同&#xff0c;磁通电机分为轴向磁通电机、径向磁通电机两大类&#xff0c;其中轴向磁通电机的磁通方向为轴向&#xff0c;载流导体系径向放置。轴向磁通电机特点在于结构上旋转转子位于定子的侧面&#…

【算法统治世界】动态规划 个人笔记总结

&#x1f389;&#x1f389;欢迎光临&#x1f389;&#x1f389; &#x1f3c5;我是苏泽&#xff0c;一位对技术充满热情的探索者和分享者。&#x1f680;&#x1f680; &#x1f31f;特别推荐给大家我的最新专栏《数据结构与算法&#xff1a;初学者入门指南》&#x1f4d8;&am…