12 Python使用xml

概述

        在上一节,我们介绍了Python的正则表达式,包括:正则表达式的定义、正则表达式的语法、re.search函数、re.match函数、re.findall函数、re.sub函数、re.compile函数、re.finditer函数、re.split函数等内容。在这一节,我们将介绍如何在Python中使用xml。

        XML英文全称为eXtensible Markup Language,中文为可扩展标记语言,是一种类似于HTML,但是没有使用预定义标记的语言。因此,XML可以根据自己的设计需求来定义专属的标记。最重要的是,因为XML的基本格式是标准化的,如果你在本地或互联网上跨系统或平台共享或传输XML,接收者仍然可以解析收到的数据。一句话总结就是:XML被设计用来传输和存储数据,不用于表现和展示数据,HTML则用来表现数据。

        在Python中,通常使用如下几种方式来处理xml。

        SAX:英文全称为Simple API for XML,逐行扫描XML文档,边扫描边解析,占用内存较小,速度较快。缺点是不能长期留驻在内存,数据不是长久的,事件过后,若没保存数据,数据便会丢失。

        DOM:英文全称为Document Object Model,会将整个XML读入内存,在内存中解析成一个树,通过对树的操作来操作XML。该方式占用内存较大,解析速度较慢。

        ElementTree:元素树,兼具了SAX方式和DOM方式的优点,占用内存较小,速度较快,使用较简单。

SAX

        SAX是一种基于事件的解析XML的接口,它不会将整个文档加载到内存中,而是逐行或逐个元素地读取文档,然后触发相应的事件。在Python中,可以使用内置的xml.sax模块来实现SAX解析器。该模块提供了一组基本的事件处理器类,可以用于处理XML的不同部分,比如:元素、属性、文本等。由于SAX不会将整个文档加载到内存中,因此它更适合处理大型XML文档。

        假如有如下的Friends.xml文件:

<?xml version='1.0' encoding='UTF-8'?>
<Friends><Friend><Name>Mike</Name><Age>18</Age></Friend><Friend><Name>Tom</Name><Age>16</Age></Friend>
</Friends>

        我们可以使用下面的示例代码来读取这个Friends.xml文件。

import os
import xml.saxclass FriendHandler(xml.sax.ContentHandler):def __init__(self):self.name = ''self.age = ''# 元素开始时调用def startElement(self, tag, attributes):self.CurrentData = tag# 元素结束时调用def endElement(self, tag):if self.CurrentData == 'Name':print('Name is', self.name)elif self.CurrentData == 'Age':print('Age is', self.age)self.CurrentData = ''# 读取字符时调用def characters(self, content):if self.CurrentData == 'Name':self.name = contentelif self.CurrentData ==  'Age':self.age = contentparser = xml.sax.make_parser()
Handler = FriendHandler()
parser.setContentHandler(Handler)
path = os.getcwd() + 'Friends.xml'
parser.parse(path)

        在上面的示例代码中,我们定义了一个名为FriendHandler的类,它继承了xml.sax.ContentHandler类,并实现了其中的三个方法,分别为:startElement、endElement和characters。当解析器遇到元素开始标签时,会调用startElement方法。当遇到元素结束标签时,会调用endElement方法。当遇到元素内的文本时,会调用characters方法。运行示例代码后,其输出如下:

Name is Mike
Age is 18
Name is Tom
Age is 16

DOM

        DOM是一种用于表示HTML和XML文档的接口标准,它提供了一种方式,使得开发者可以通过编程方式访问和修改文档的内容和结构。在Python中,可以使用多种库来实现DOM解析器,比如:xml.dom.minidom、lxml等。

        在下面的示例代码中,我们使用xml.dom.minidom来解析上面提到的Friends.xml文件。另外,我们还可以使用minidom.parseString来解析xml字符串。

import xml.dom.minidom as minidomdoc = minidom.parse('Friends.xml')
root = doc.documentElement 
children = root.childNodes
for child in children:if child.nodeName == 'Friend':name = child.getElementsByTagName('Name')[0]print('Name is', name.childNodes[0].data)age = child.getElementsByTagName('Age')[0]print('Age is', age.childNodes[0].data)

ElementTree

        ElementTree提供了一个简单而高效的API用于解析和创建XML数据,它使用了一种基于树的模型来表示XML文档,使得我们可以很方便地访问和修改XML数据的元素和属性。

        在下面的示例代码中,我们使用ElementTree来解析上面提到的Friends.xml文件。

import xml.etree.ElementTree as ETtree = ET.parse('Friends.xml')
root = tree.getroot()
for friend in root:name = friend[0]print('Name is', name.text)age = friend[1]print('Age is', age.text)

        使用ElementTree,我们还可以很方便地生成xml,并保存到文件或字符串中。下面示例代码中生成的Friends_new.xml文件的内容,与上面提到的Friends.xml文件的内容相同。

import xml.etree.ElementTree as ETroot = ET.Element('Friends')child = ET.SubElement(root, 'Friend')
child_name = ET.SubElement(child, 'Name')
child_name.text = 'Mike'
child_age = ET.SubElement(child, 'Age')
child_age.text = '18'child = ET.SubElement(root, 'Friend')
child_name = ET.SubElement(child, 'Name')
child_name.text = 'Tom'
child_age = ET.SubElement(child, 'Age')
child_age.text = '16'tree = ET.ElementTree(root)
with open('Friends_new.xml', 'wb') as file:tree.write(file, 'UTF-8')

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/73967.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

从零开始学习软件测试-第41天笔记

jmeter操作 线程组的运行顺序 线程组之间是并行运行的。想要让线程组按顺序运行&#xff0c;需要点击测试计划&#xff0c;勾选独立运行每个线程组。 跨线程组传参 首先要保证线程按顺序运行。在一个线程组中使用函数&#xff0c;setproperty函数将局部变量变为全局变量。填…

c++推箱子小游戏

上代码: #include <stdio.h> #include <stdlib.h> #include <conio.h>int map[2][7][8] {//0:空的 1:■ :墙//3&#xff1a;☆ 4&#xff1a;★ //目的地和箱子//5&#xff1a;※ //人//7:⊙ //目的(3)和箱子(4)在一起//8&#xff1a;※ //人(5…

Spring学习笔记——3

Spring学习笔记——3 一、AOP简介1.1、AOP概述1.2、AOP思想的实现方案1.3、模拟AOP的基础代码1.4、AOP的相关概念 二、基于XML配置的AOP2.1、XML方式AOP快速入门2.2、XML方式AOP配置详解2.3、XML方式AOP原理剖析 三、基于注解配置AOP3.1、注解方式AOP基本使用3.2、注解方式AOP配…

手写Spring:第15章-通过注解注入属性信息

文章目录 一、目标&#xff1a;通过注解注入属性信息二、设计&#xff1a;通过注解注入属性信息三、实现&#xff1a;通过注解注入属性信息3.1 工程结构3.2 自动扫描注入占位符配置和对象类图3.3 读取属性并填充到容器中3.3.1 定义解析字符串接口3.3.2 配置Bean工厂添加解析器3…

基于Java+SpringBoot+Vue前后端分离农产品直卖平台设计和实现

博主介绍&#xff1a;✌全网粉丝30W,csdn特邀作者、博客专家、CSDN新星计划导师、Java领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和毕业项目实战✌ &#x1f345;文末获取源码联系&#x1f345; &#x1f447;&#x1f3fb; 精彩专…

GO语言网络编程(并发编程)runtime包

GO语言网络编程&#xff08;并发编程&#xff09;runtime包 1. runtime包 1.1.1. runtime.Gosched() 让出CPU时间片&#xff0c;重新等待安排任务(大概意思就是本来计划的好好的周末出去烧烤&#xff0c;但是你妈让你去相亲,两种情况第一就是你相亲速度非常快&#xff0c;见…

手写签名到背景上合为1张图

手写签名到背景上合为1张图 package.json中 "signature_pad": "3.0.0-beta.3"<template><div class"home"><canvas id"canvas" width"500" height"300"></canvas><button click"…

ELK高级搜索(三)

文章目录 11&#xff0e;索引Index入门11.1 索引管理11.2 定制分词器11.3 type底层结构11.4 定制dynamic mapping11.5 零停机重建索引 12&#xff0e;中文分词器 IK分词器12.1 Ik分词器安装使用12.2 ik配置文件12.3 使用mysql热更新 13&#xff0e;java api 实现索引管理14&…

026:vue中el-progress逆向倒计时方式显示

第026个 查看专栏目录: VUE ------ element UI 专栏目标 在vue和element UI联合技术栈的操控下&#xff0c;本专栏提供行之有效的源代码示例和信息点介绍&#xff0c;做到灵活运用。 &#xff08;1&#xff09;提供vue2的一些基本操作&#xff1a;安装、引用&#xff0c;模板使…

Redis多机数据库实现

Redis多机数据库实现 为《Redis设计与实现》笔记 复制 客户端可以使用SLAVEOF命令将指定服务器设置为该服务器的主服务器 127.0.0.1:12345> SLAVEOF 127.0.0.1 6379127.0.0.1:6379将被设置为127.0.0.1:123456的主服务器 旧版复制功能的实现 Redis的复制功能分为同步&a…

通过git bash激活虚拟环境遇到的问题

直接git bash后用conda activate激活一直报错 报错如下&#xff1a; CommandNotFoundError: Your shell has not been properly configured to use ‘conda activate’. If using ‘conda activate’ from a batch script, change your invocation to ‘CALL conda.bat activa…

【linux命令讲解大全】088.深入理解 shell 脚本中的 trap 命令

文章目录 trap概要主要用途选项参数返回值关于信号例子 从零学 python trap 捕捉信号和其他事件并执行命令。 概要 trap [-lp] [[arg] signal_spec ...]主要用途 用于指定在接收到信号后将要采取的动作。 脚本程序被中断时执行清理工作。 选项 -l&#xff1a;打印信号名称…

Linux之history、tab、alias、命令执行顺序、管道符以及exit

目录 Linux之history、tab、alias、命令执行顺序、管道符以及exit history历史命令 格式 参数 修改默认记录历史命令条数 案例 案例1 --- 显示history历史记录中出现次数最高的top10 案例2 --- 增加history显示的时间信息 命令与文件名补全 --- tab 命令别名 格式 案…

MySQL事务管理

文章目录 MySQL事务管理0. MySQL的CURD不加控制&#xff0c;出现的问题1. 什么是事务2. 为什么会出现事务3. 事务的版本支持与提交方式3.1 版本支持3.2 提交方式 4. 事务的操作4.0 准备工作4.1 事务正常操作(1) 创建保存点后, rollback(2) 直接rollback(3) 正常提交 4.2 事务异…

学生免费申请IDEA使用流程

IntelliJ IDEA一般简称IDEA&#xff0c;是Java编程语言开发的集成环境&#xff0c;在业界被公认为最好的Java开发工具。 1 IDEA官网下载 1.1 官网地址 https://www.jetbrains.com/idea/ 1.2 IDEA下载 访问官网&#xff0c;单击download按钮&#xff0c;下载“IntelliJ IDE…

牛客练习赛115 A Mountain sequence

题目&#xff1a; 样例&#xff1a; 输入 3 5 1 2 3 4 5 3 3 3 3 3 1 2 1 输出 16 1 3 思路&#xff1a; 依据题意&#xff0c;再看数据范围&#xff0c;可以知道暴力肯定是不可能了&#xff0c;然后通过题目意思&#xff0c;我们可以排列模拟一下&#xff0c;这里排列所得结…

双系统Ubuntu安装

1、准备ubuntu的iso镜像文件 先去ubuntu官网下载.iso的镜像文件 iso下载地址:https://releases.ubuntu.com/22.04.3/ubuntu-22.04.3-desktop-amd64.iso?_ga2.9744373.1300503101.1694258700-735129253.1694258700 2、下载usewrite刻录iso到u盘 usbwrite下载地址&#xff1…

Vue+NodeJS上传图片到腾讯云Cos

一.前端Vue 1.选择图片 --HTML <input type"file" accept"image/*" change"handleFileChange"> <el-button size"large" click"changeAvatar">上传头像</el-button> //选择图片 function handleFileC…

ubuntu22.04 设置网卡开机自启

配置文件路径 在Ubuntu中&#xff0c;网络配置文件通常位于/etc/netplan/目录下&#xff0c;其文件名以.yaml为后缀。Netplan是Ubuntu 17.10及更高版本中默认的网络配置工具&#xff0c;用于配置网络接口、IP地址、网关、DNS服务器等。 我们可以看到配置文件为 01-network-ma…

48、springboot 的国际化之让用户在程序界面上弄个下拉框,进行动态选择语言

上一篇是直接改浏览器的支持语言。 在浏览器上面直接改国际化语言 这次要实现的功能是直接在程序界面动态选择语言。 Locale 代表语言、国家。 ★ 在界面上动态改变语言 应用之所以能动态呈现不同的语言界面&#xff0c;其实关键在于如何确定客户端的Locale&#xff08;代…