Java 解析XML的几种方法

XML现在已经成为一种通用的数据交换格式,它的平台无关性,语言无关性,系统无关性,给数据集成与交互带来了极大的方便。

XML在不同的语言里解析方式都是一样的,只不过实现的语法不同而已。

基本的解析方式有两种,一种叫SAX,另一种叫DOM。

SAX是基于事件流的解析,DOM是基于XML文档树结构的解析。

假设我们XML的内容和结构如下: 

1
2
3
4
5
6
7
8
<?xml version="1.0" encoding="UTF-8"?>
<employees>
<employee>
<name>ddviplinux</name>
<sex>m</sex>
<age>30</age>
</employee>
</employees>

下面使用JAVA语言来实现DOM与SAX的XML文档生成与解析。 

首先定义一个操作XML文档的接口XmlDocument 它定义了XML文档的建立与解析的接口。

 

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
package com.alisoft.facepay.framework.bean;
/**
*
* @author hongliang.dinghl
* 定义XML文档建立与解析的接口
*/
public interface XmlDocument {
/**
* 建立XML文档
* @param fileName 文件全路径名称
*/
public void createXml(String fileName);
/**
* 解析XML文档
* @param fileName 文件全路径名称
*/
public void parserXml(String fileName);
}


1.DOM生成和解析XML文档
 

为 XML 文档的已解析版本定义了一组接口。解析器读入整个文档,然后构建一个驻留内存的树结构,然后代码就可以使用 DOM 接口来操作这个树结构。优点:整个文档树在内存中,便于操作;支持删除、修改、重新排列等多种功能;缺点:将整个文档调入内存(包括无用的节点),浪费时间和空间;使用场合:一旦解析了文档还需多次访问这些数据;硬件资源充足(内存、CPU)。 

复制代码
  1 package com.alisoft.facepay.framework.bean; 
  2 import java.io.FileInputStream; 
  3 import java.io.FileNotFoundException; 
  4 import java.io.FileOutputStream; 
  5 import java.io.IOException; 
  6 import java.io.InputStream; 
  7 import java.io.PrintWriter; 
  8 import javax.xml.parsers.DocumentBuilder; 
  9 import javax.xml.parsers.DocumentBuilderFactory; 
 10 import javax.xml.parsers.ParserConfigurationException; 
 11 import javax.xml.transform.OutputKeys; 
 12 import javax.xml.transform.Transformer; 
 13 import javax.xml.transform.TransformerConfigurationException; 
 14 import javax.xml.transform.TransformerException; 
 15 import javax.xml.transform.TransformerFactory; 
 16 import javax.xml.transform.dom.DOMSource; 
 17 import javax.xml.transform.stream.StreamResult; 
 18 import org.w3c.dom.Document; 
 19 import org.w3c.dom.Element; 
 20 import org.w3c.dom.Node; 
 21 import org.w3c.dom.NodeList; 
 22 import org.xml.sax.SAXException; 
 23 /** 
 24 * 
 25 * @author hongliang.dinghl 
 26 * DOM生成与解析XML文档 
 27 */ 
 28 public class DomDemo implements XmlDocument { 
 29 private Document document; 
 30 private String fileName; 
 31 public void init() { 
 32 try { 
 33 DocumentBuilderFactory factory = DocumentBuilderFactory 
 34 .newInstance(); 
 35 DocumentBuilder builder = factory.newDocumentBuilder(); 
 36 this.document = builder.newDocument(); 
 37 } catch (ParserConfigurationException e) { 
 38 System.out.println(e.getMessage()); 
 39 } 
 40 } 
 41 public void createXml(String fileName) { 
 42 Element root = this.document.createElement("employees"); 
 43 this.document.appendChild(root); 
 44 Element employee = this.document.createElement("employee"); 
 45 Element name = this.document.createElement("name"); 
 46 name.appendChild(this.document.createTextNode("丁宏亮")); 
 47 employee.appendChild(name); 
 48 Element sex = this.document.createElement("sex"); 
 49 sex.appendChild(this.document.createTextNode("m")); 
 50 employee.appendChild(sex); 
 51 Element age = this.document.createElement("age"); 
 52 age.appendChild(this.document.createTextNode("30")); 
 53 employee.appendChild(age); 
 54 root.appendChild(employee); 
 55 TransformerFactory tf = TransformerFactory.newInstance(); 
 56 try { 
 57 Transformer transformer = tf.newTransformer(); 
 58 DOMSource source = new DOMSource(document); 
 59 transformer.setOutputProperty(OutputKeys.ENCODING, "gb2312"); 
 60 transformer.setOutputProperty(OutputKeys.INDENT, "yes"); 
 61 PrintWriter pw = new PrintWriter(new FileOutputStream(fileName)); 
 62 StreamResult result = new StreamResult(pw); 
 63 transformer.transform(source, result); 
 64 System.out.println("生成XML文件成功!"); 
 65 } catch (TransformerConfigurationException e) { 
 66 System.out.println(e.getMessage()); 
 67 } catch (IllegalArgumentException e) { 
 68 System.out.println(e.getMessage()); 
 69 } catch (FileNotFoundException e) { 
 70 System.out.println(e.getMessage()); 
 71 } catch (TransformerException e) { 
 72 System.out.println(e.getMessage()); 
 73 } 
 74 } 
 75 public void parserXml(String fileName) { 
 76 try { 
 77 DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance(); 
 78 DocumentBuilder db = dbf.newDocumentBuilder(); 
 79 Document document = db.parse(fileName); 
 80 NodeList employees = document.getChildNodes(); 
 81 for (int i = 0; i < employees.getLength(); i++) { 
 82 Node employee = employees.item(i); 
 83 NodeList employeeInfo = employee.getChildNodes(); 
 84 for (int j = 0; j < employeeInfo.getLength(); j++) { 
 85 Node node = employeeInfo.item(j); 
 86 NodeList employeeMeta = node.getChildNodes(); 
 87 for (int k = 0; k < employeeMeta.getLength(); k++) { 
 88 System.out.println(employeeMeta.item(k).getNodeName() 
 89 + ":" + employeeMeta.item(k).getTextContent()); 
 90 } 
 91 } 
 92 } 
 93 System.out.println("解析完毕"); 
 94 } catch (FileNotFoundException e) { 
 95 System.out.println(e.getMessage()); 
 96 } catch (ParserConfigurationException e) { 
 97 System.out.println(e.getMessage()); 
 98 } catch (SAXException e) { 
 99 System.out.println(e.getMessage()); 
100 } catch (IOException e) { 
101 System.out.println(e.getMessage()); 
102 } 
103 } 
104 } 
复制代码

 

2.SAX生成和解析XML文档

使用SAXReader需要导入dom4j-full.jar包。

dom4j是一个Java的XML API,类似于jdom,用来读写XML文件的。dom4j是一个非常非常优秀的Java XML API,具有性能优异、功能强大和极端易用使用的特点,同时它也是一个开放源代码的软件,可以在SourceForge上找到它。

使用举例:

 s.xml内容

<?xml version="1.0" encoding="GB2312"?>  
<data>  <row queryDTO.enterpriseId="gfd" queryDTO.loginName="gdfg" queryDTO.state="0"/>  
</data>  

解析

复制代码
复制代码
import java.io.File;  
import java.io.FileInputStream;  
import java.io.FileNotFoundException;  
import java.util.Iterator;  
import java.util.List;  
import org.dom4j.Document;  
import org.dom4j.DocumentException;  
import org.dom4j.Element;  
import org.dom4j.io.SAXReader;  
import org.dom4j.tree.AbstractAttribute;  public class ReadXMLTest {  public static void main(String[] args){  File xmlFile = new File("C:/s.xml");  FileInputStream fis = null;  try {  fis = new FileInputStream(xmlFile);  } catch (FileNotFoundException e) {  e.printStackTrace();  System.err.println("File is not exsit!");  }  SAXReader saxReader = new SAXReader();  List rowList = null;  try {  //生成文档对应实体  Document doc = saxReader.read(fis);  //获取指定路径下的元素列表,这里指获取所有的data下的row元素  rowList = doc.selectNodes("//data/row");  } catch (DocumentException e) {  e.printStackTrace();  }  for(Iterator iter = rowList.iterator();iter.hasNext();){  //获得具体的row元素   Element element = (Element)iter.next();  //获得row元素的所有属性列表  List elementList = element.attributes();  for(Iterator iter1 = elementList.iterator();iter1.hasNext();){  //将每个属性转化为一个抽象属性,然后获取其名字和值  AbstractAttribute aa = (AbstractAttribute)iter1.next();  System.out.println("Name:"+aa.getName()+";Value:"+aa.getValue());  }  //输出:  //Name:queryDTO.enterpriseId;Value:gfd  //Name:queryDTO.loginName;Value:gdfg  //Name:queryDTO.state;Value:0  System.out.println(element.getName());  //输出:  //row  // 取得row元素的queryDTO.enterpriseId属性的值  System.out.println(element.attributeValue("queryDTO.enterpriseId"));  //输出:  //gfd  //如果element下有子元素,(类似width="**"),要想获得该子元素的值,可以用如下方法  System.out.println(element.elementText("width"));//因为没有,所以输出为null。  }  }  
}  
复制代码
复制代码

3.DOM4J生成和解析XML文档

DOM4J 是一个非常非常优秀的Java XML API,具有性能优异、功能强大和极端易用使用的特点,同时它也是一个开放源代码的软件。如今你可以看到越来越多的 Java 软件都在使用 DOM4J 来读写 XML,特别值得一提的是连 Sun 的 JAXM 也在用 DOM4J。

Java代码

复制代码
 1 package com.alisoft.facepay.framework.bean;   
 2 import java.io.File;   
 3 import java.io.FileWriter;   
 4 import java.io.IOException;   
 5 import java.io.Writer;   
 6 import java.util.Iterator;   
 7 
 8 import org.dom4j.Document;   
 9 import org.dom4j.DocumentException;   
10 import org.dom4j.DocumentHelper;   
11 import org.dom4j.Element;   
12 import org.dom4j.io.SAXReader;   
13 import org.dom4j.io.XMLWriter;   
14 /**  
15 *   
16 * @author hongliang.dinghl  
17 * Dom4j 生成XML文档与解析XML文档  
18 */  
19 public class Dom4jDemo implements XmlDocument {   
20 
21 public void createXml(String fileName) {   
22 Document document = DocumentHelper.createDocument();   
23 Element employees=document.addElement("employees");   
24 Element employee=employees.addElement("employee");   
25 Element name= employee.addElement("name");   
26 name.setText("ddvip");   
27 Element sex=employee.addElement("sex");   
28 sex.setText("m");   
29 Element age=employee.addElement("age");   
30 age.setText("29");   
31 try {   
32 Writer fileWriter=new FileWriter(fileName);   
33 XMLWriter xmlWriter=new XMLWriter(fileWriter);   
34 xmlWriter.write(document);   
35 xmlWriter.close();   
36 } catch (IOException e) {   
37 
38 System.out.println(e.getMessage());   
39 }   
40 
41 
42 }   
43 
44 
45 public void parserXml(String fileName) {   
46 File inputXml=new File(fileName);   
47 SAXReader saxReader = new SAXReader();   
48 try {   
49 Document document = saxReader.read(inputXml);   
50 Element employees=document.getRootElement();   
51 for(Iterator i = employees.elementIterator(); i.hasNext();){   
52 Element employee = (Element) i.next();   
53 for(Iterator j = employee.elementIterator(); j.hasNext();){   
54 Element node=(Element) j.next();   
55 System.out.println(node.getName()+":"+node.getText());   
56 }   
57 
58 }   
59 } catch (DocumentException e) {   
60 System.out.println(e.getMessage());   
61 }   
62 System.out.println("dom4j parserXml");   
63 }   
64 }    
复制代码

4.JDOM生成和解析XML  

为减少DOM、SAX的编码量,出现了JDOM;优点:20-80原则,极大减少了代码量。使用场合:要实现的功能简单,如解析、创建等,但在底层,JDOM还是使用SAX(最常用)、DOM、Xanan文档。   

复制代码
 1 package com.alisoft.facepay.framework.bean;   
 2 
 3 import java.io.FileNotFoundException;   
 4 import java.io.FileOutputStream;   
 5 import java.io.IOException;   
 6 import java.util.List;   
 7 
 8 import org.jdom.Document;   
 9 import org.jdom.Element;   
10 import org.jdom.JDOMException;   
11 import org.jdom.input.SAXBuilder;   
12 import org.jdom.output.XMLOutputter;   
13 /**  
14 *   
15 * @author hongliang.dinghl  
16 * JDOM 生成与解析XML文档  
17 *   
18 */  
19 public class JDomDemo implements XmlDocument {   
20 
21 public void createXml(String fileName) {   
22 Document document;   
23 Element  root;   
24 root=new Element("employees");   
25 document=new Document(root);   
26 Element employee=new Element("employee");   
27 root.addContent(employee);   
28 Element name=new Element("name");   
29 name.setText("ddvip");   
30 employee.addContent(name);   
31 Element sex=new Element("sex");   
32 sex.setText("m");   
33 employee.addContent(sex);   
34 Element age=new Element("age");   
35 age.setText("23");   
36 employee.addContent(age);   
37 XMLOutputter XMLOut = new XMLOutputter();   
38 try {   
39 XMLOut.output(document, new FileOutputStream(fileName));   
40 } catch (FileNotFoundException e) {   
41 e.printStackTrace();   
42 } catch (IOException e) {   
43 e.printStackTrace();   
44 }   
45 
46 }   
47 
48 public void parserXml(String fileName) {   
49 SAXBuilder builder=new SAXBuilder(false);    
50 try {   
51 Document document=builder.build(fileName);   
52 Element employees=document.getRootElement();    
53 List employeeList=employees.getChildren("employee");   
54 for(int i=0;i<employeelist.size();i++){ <br="">Element employee=(Element)employeeList.get(i);   
55 List employeeInfo=employee.getChildren();   
56 for(int j=0;j<employeeinfo.size();j++){ <br="">System.out.println(((Element)employeeInfo.get(j)).getName()+":"+((Element)employeeInfo.get(j)).getValue());   
57 
58 }   
59 }   
60 } catch (JDOMException e) {   
61 
62 e.printStackTrace();   
63 } catch (IOException e) {   
64 
65 e.printStackTrace();   
66 }    
67 
68 }   
69 }   
复制代码



本文转自邴越博客园博客,原文链接:http://www.cnblogs.com/binyue/p/3388689.html,如需转载请自行联系原作者

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/286282.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【前端就业课 第二阶段】CSS 零基础到实战(03)前端 CSS 动效 transition transform

本系列文章持续更新&#xff0c;点击专栏就可以看其他文章&#xff1a;点击进入专栏 整个前端学习路线 以下路线为 CSDN C认提供&#xff1a; 如果想 快点搞完 并且 就业 可以选择超级实习生计划 如果有技术想稳定点找工作&#xff0c;可以C认证&#xff0c;C认证还可以 内…

C#基于.Net-HtmlAgilityPack库的爬虫初体验

讲故事前几天有点空闲时间&#xff0c;在github上看一些.Net的开源库&#xff0c;看到了关于爬虫相关的库&#xff0c;于是加入了一个QQ群&#xff0c;看到里面各位大佬讨论的是爬的越好&#xff0c;进去越快&#xff0c;于是我自己也想做一个爬虫相关的东西&#xff0c;但是爬…

Android中文图混排时文图的居中对齐 FontMetrics以及自定义ImageSpan实现

文章转自&#xff1a;http://www.sohu.com/a/150059234_611601 本文作者CnPeng的博客地址&#xff1a; http://www.jianshu.com/p/2650357f7547 这个标题有点长&#xff0c;乍一看这么个标题你可能没明白啥意思&#xff0c;且听我慢慢道来。 公司的项目中新增了一个“心动”…

关于事件监听机制的总结(Listener和Adapter)

记得以前看过事件监听机制背后也是有一种设计模式的.(设计模式的名字记不清了,只记得背后实现的数据结构是数组.) 附上事件监听机制的分析图: 一个事件源可以承载多个事件(只要这个事件源支持这个事件就可以,男人就不支持生孩子的事件) 事件和监听器有对应关系的. 下面用awt中…

一、首页、详情页、文章编辑页制作《iVX低代码/无代码个人博客制作》

注&#xff1a;iVX也有免费直播课《第八期直播课》 一、首页制作 首页预览如下&#xff1a; 首先在博客页创建一个相对应项目&#xff1a; 接着选择前台&#xff0c;创建一个页面&#xff0c;命名为首页&#xff1a; 接着更改当前屏幕为小屏尺寸&#xff1a; 接着我们分…

Saga体系结构模式:微服务架构下跨服务事务的实现

在服务端应用程序中&#xff0c;我们往往会通过事务处理来保证数据一致性&#xff08;Data Consistency&#xff09;&#xff0c;例如&#xff1a;当用户从库存中取走了一定数量的物品&#xff0c;这些物品会体现在用户的提货单上&#xff0c;与此同时&#xff0c;库存中物品的…

GPhone、OPhone、UPhone、APhone、IPhone:满城尽带XPhone

本文为原创&#xff0c;如需转载&#xff0c;请注明作者和出处&#xff0c;谢谢&#xff01; 最近一段时间智能手机市场是翻天覆地。各大厂商纷纷推出自己的手机操作系统和手机。Google、Apple、中国移动、中国联通纷纷推出或即将推出自已 的智能手机操作系统&#xff08;虽…

二、文章发布页制作及后台实现《iVX低代码/无代码个人博客制作》

注&#xff1a;iVX也有免费直播课《第八期直播课》 一、文章编辑页制作 当首页制作完毕后&#xff0c;需要显示内容就需要有文章数据&#xff0c;此时我们创建一个文章编辑页增加对应的数据。 那么我们创建一个页面&#xff0c;命名为文章发布页&#xff1a; 接着我们查看标…

VS2013配置pro*C/C++开发环境

2019独角兽企业重金招聘Python工程师标准>>> 1、软件&#xff1a;VS2013&#xff0c;oracle10g 2、VS2013 新建VC空项目&#xff0c;然后在源文件中新建一个*.pc文件&#xff08;不知道我的配置哪儿有问题&#xff0c;新建的pc文件必须和工程同名&#xff09;&#…

Windows 11 23H2 25131 推送!全新搜索体验,优化应用商店

面向 Dev频道的 Windows 预览体验成员&#xff0c;微软现已推送 Windows 11 预览版 Build 25131。主要变化1.微软为 Windows 11 搜索引入全新体验&#xff0c;当您在搜索结果中点击“打开文件位置”时&#xff0c;现在将选择文件资源管理器中的文件&#xff0c;此前只是打开文件…

C# RichTextBox 实现循环查找关键字

实现效果如上图&#xff0c;点击“Search”按钮&#xff0c;开始从文首查找关键字“menu”&#xff0c;并高亮&#xff0c;再次点击“Search”按钮&#xff0c;继续查找下一个。查找到文末&#xff0c;自动从文首重新查找。 private int _searchIndex 0;//查找开始位置/// <…

网站常见漏洞-- XSS攻击

跨站攻击&#xff0c;即Cross Site Script Execution(通常简写为XSS&#xff0c;因为CSS与层叠样式表同名&#xff0c;故改为XSS) 是指攻击者利用网站程序对用户输入过滤不足&#xff0c;输入可以显示在页面上对其他用户造成影响的HTML代码&#xff0c;从而盗取用户资料、利用用…

【ArcGIS遇上Python】从入门到精通系列之第一章:ArcGIS Python简介

文章目录1. Python简介2. Python的特点3. ArcGIS的脚本语言4. ArcGIS中的Python脚本编辑器1. Python简介 Python是一种跨平台的计算机程序设计语言。 是一个高层次的结合了解释性、编译性、互动性和面向对象的脚本语言。最初被设计用于编写自动化脚本(shell)&#xff0c;随着版…

C# RichTextBox 做简单的HTML代码编辑器 ---------左侧显示行号

说明&#xff1a;此显示行号为实际行号&#xff0c;不论是空行还是自动换行&#xff0c;都计算在内&#xff0c;跟实际IDE的行号不同&#xff0c;同步滚动会有半行高度以内的误差。 实现原理&#xff0c;在RichTextBox 编辑器左侧放置另一RichTextBox &#xff08;或其它控件也…

五、文章详情页制作及跳转功能实现《iVX低代码/无代码个人博客制作》

注&#xff1a;iVX也有免费直播课《第八期直播课》 一、详情页制作 在之前的章节中&#xff0c;我们已经制作完毕了登录、注册、首页等内容&#xff0c;在这一节中&#xff0c;我们编写详情页以及详情页功能制作。 详情页页面如下&#xff1a; 详情页头部也就是一个头部栏&…

c++ 数据类型转换: static_cast dynamic_cast reinterpret_cast const_cast

c 数据类型转换&#xff1a; static_cast dynamic_cast reinterpret_cast const_cast 【版权声明】转载请注明出处 http://www.cnblogs.com/TenosDoIt/p/3175217.html【目录】 引言 static_cast 定义 dynamic_cast 定义 举例&#xff1a;下行转换&#xff08;把基类的指针或引用…

日用有余!国产中科方德桌面操作系统初体验

国产IT圈里最受关注的话题&#xff0c;除了芯片想必就是操作系统了。但真说起国产操作系统&#xff0c;大家是既熟悉又陌生&#xff0c;听说过的多而真正使用过的少。而伴随产业发展&#xff0c;市面上也涌现出众多国产操作软件&#xff0c;这些系统是否好用&#xff1f;能否满…

C# RichTextBox 做简单的HTML代码编辑器 ---------利用WinApi修正左侧显示行号 误差

说明&#xff1a;通过WinApi可以准确定准滚动位置。 //行号 生成显示 这里rtbLineNum用的 RichTextBox&#xff0c;也可以用其它private void ShowLineNum(){rtbLineNum.Text "";//计算行高&#xff0c;行数int linesLength 0;var pFirst tbEditor.GetPositionFr…

Angular - - angular.element

angular.element 将DOM元素或者HTML字符串一包装成一个jQuery元素。 格式&#xff1a;angular.element(element); element&#xff1a;包装成jquery对象的html字符串或者dom元素 jqLite提供的方法&#xff1a; addClass()after()append()attr()bind() – 不支持命名空间,选择器…

六、文章详情显示及点赞实现《iVX低代码/无代码个人博客制作》

注&#xff1a;iVX也有免费直播课《第八期直播课》 一、文章详情实现 上一节我们已经完成了首页的内容显示&#xff0c;那么此时我们完成点击后跳转到详情页内容。 那么此时由于我们需要跳转到详情页需要对应的数据ID&#xff0c;那么此时还需要给首页的文章数据对象数组一个…