一、XML介绍
当我们想要在不同的程序、系统或平台之间共享信息时,就需要一种统一的方式来组织和表示数据。XML(EXtensible Markup Language,即可扩展标记语言)是一种用于描述数据的标记语言,它让数据以一种结构化的方式呈现,使得计算机程序能够轻松理解和处理这些数据。
XML有以下特点:
- 可扩展性:XML 标记集合不是固定的,可以根据需要进行扩展。它允许用户自定义标记,因此可以根据需要创建自定义的数据结构和标记集合,使其适应各种不同的应用场景。
- 自我描述性:XML 文档包含标签(元素)和属性,这些标签和属性的名称通常反映了其所包含数据的含义。因此,XML 文档本身提供了关于数据结构和含义的信息。
- 结构化:XML 使用标记来标识数据,并通过元素之间的嵌套关系来表示数据的结构,使其更易于理解和处理。
- 跨平台性:XML是一种独立于平台和编程语言的标记语言,可以在各种不同的操作系统和软件环境中使用,并且能够轻松地与网络上的其他系统进行数据交换。
- 数据分离:XML将数据与其格式和结构分离开来,使得数据和显示方式之间有了清晰的分界,这有助于更灵活地管理和维护数据。
- 通用性:XML 广泛应用于各种领域,例如数据交换、配置文件、Web服务等,因其通用性而受到广泛支持和应用。
二、XML的解析
常见的XML解析方式有以下几种:
- DOM 解析:DOM(Document Object Model,文档对象模型)解析器会将整个 XML 文档加载到内存中,并将其表示为一个树形结构,开发者可以通过遍历树节点来访问和操作 XML 元素和属性。
- SAX 解析:SAX(Simple API for XML)解析器是一种基于事件驱动的解析方式,它顺序读取 XML 文档,当遇到 XML 元素、文本或其他事件时,会触发相应的回调函数,开发者可以在回调函数中处理这些事件。
- XPath:XPath 是一种用于在 XML 文档中定位节点的语言,可以通过路径表达式来指定节点的位置和关系,从而实现对 XML 数据的精确访问和提取。
- XSLT:可扩展样式表语言转换(EXtensible Stylesheet Language Transformations)是一种基于 XML 的语言,用于对 XML 数据进行转换和处理。可以将XML数据档转换为另外的XML或其它格式,如HTML网页,纯文字等。
- 第三方库和工具:除了语言内置的解析库外,还有许多第三方库和工具可用于解析 XML 文件,如 lxml(Python)、Jsoup(Java)、XmlReader(C#)等。
三、TinyXML-2简介
TinyXML-2 是一个简单、小型、高效的 C++ XML 解析器,可被轻易地集成到其他程序中。它使用文档对象模型(DOM)的方式解析XML,可使用它解析 XML 文档,并读取、修改和保存的文档对象模型。
使用TinyXML-2可以实现对XML文件的:创建、解析、修改等功能。
该项目的GitHub链接如下:
TinyXML-2 【github项目】
也可以从此处下载TinyXML2源码(免费,不需要积分):
【免费】XML解析工具-TinyXML2-源代码-C++资源-CSDN文库
四、XML解析示例
4.1 创建测试用的XML文件
创建testXML.xml,内容如下所示:
<?xml version="1.0" encoding="utf-8"?>
<!--for test-->
<system><android><NULL>null</NULL></android><windows><windows7><apps><app>windows7 c</app><app>windows7 c++</app><app>windows7 java</app><app>windows7 python</app></apps></windows7><windows10><apps><app>windows10 c</app><app>windows10 c++</app><app>windows10 java</app><app>windows10 python</app></apps></windows10><windows11><apps><app>windows11 c</app><app>windows11 c++</app><app>windows11 java</app><app>windows11 python</app></apps></windows11></windows><linux><ubuntu><apps><app>ubuntu_c</app><app>ubuntu_c++</app><app>ubuntu_java</app><app>ubuntu_python</app></apps></ubuntu><centos><apps><app>centos_c</app><app>centos_c++</app><app>centos_java</app><app>centos_python</app></apps></centos></linux>
</system>
注:
- 根元素为 system ,其中包含 android、windows、linux三个操作系统大类。
- 每个操作系统大类下又包含具体的操作系统版本,如windows包含windows7、windows10、windows11等。
- 对每一个具体的操作系统版本,包含了用以存储若干app的 apps 。
- 每个应用存储到具体的某个app中。
4.2 拷贝TinyXML-2项目的代码
将TinyXML-2项目中的 tinyxml2.cpp、tinyxml2.h 两个文件拷贝到当前的工作目录。
4.3 编写XML解析的测试代码
本次以 读取并输出 “某类操作系统” 中的 “各个具体操作系统版本” 的 “app内容” 为例:
创建readxml.cpp并编辑,该文件内容如下:
#include <iostream>
#include <vector>
#include "tinyxml2.h"using namespace tinyxml2;
using namespace std;//定义结构体OS_APPS以进行数据存储
typedef struct os_apps{string osname;vector<string> apps;
} OS_APPS;//输出容器中的所有信息
void show(vector<OS_APPS> &v)
{cout<<"\n----------print----------" << endl;for(OS_APPS oa : v){cout << "osname: " << oa.osname << endl;int cnt = 1;for(auto app : oa.apps){cout << "app" << cnt << ": " << app << endl;cnt ++;}cout << endl;}
}//从XMLDocument中读取指定的操作系统大类,并存储到容器中
void read_xml(XMLDocument* doc, vector<OS_APPS> &v, const char* target_os)
{// 获取根元素XMLElement* root = doc->RootElement(); if (!root) {std::cout << "No root element found!" << std::endl;exit(1);}// 查找指定OS类别XMLElement* os_element = root->FirstChildElement(target_os);if (!os_element) {// 未找到指定元素cout << "os_element not found!" << endl;exit(1);}// 遍历所有指定分类下的所有子OSXMLElement* sub_os_element = os_element -> FirstChildElement();if(!sub_os_element){cout << "can't get sub_os_element!" << endl;exit(1);}while(sub_os_element){OS_APPS oa;vector<string> s;//获取子操作系统的名称oa.osname = sub_os_element -> Value();//获取存储apps列表的节点XMLElement* apps_element = sub_os_element -> FirstChildElement();if(!apps_element){cout << "can't read " << oa.osname << "'apps, please check XML file!" << endl;exit(1);}else{cout << "begin to read " << oa.osname << "'s apps" << endl;}//获取每一个app元素,并继续读取其他同级app内容XMLElement* app_element = apps_element -> FirstChildElement();while(app_element){s.push_back(app_element -> GetText());app_element = app_element -> NextSiblingElement();}//存储oa.apps = s;v.push_back(oa);//继续处理同级的其他子OSsub_os_element = sub_os_element -> NextSiblingElement();}}int main( int argc, const char ** argv)
{//读取的数据将存放在容器v中vector<OS_APPS> v;//参数校验if(argc == 1){cout << "please input the XML filename!" << endl;exit(0);}//打开文件XMLDocument* doc = new XMLDocument();doc->LoadFile( argv[1] );if (doc->ErrorID() != XML_SUCCESS) {cout << "Error loading XML file!" << endl;return 1;}printf( "XML file '%s' is loaded.\n", argv[1]);//读取指定类别信息,并存储到容器v中read_xml(doc, v, "windows");//输出读取的信息show(v);return 0;
}
4.4 生成可执行程序
在命令行执行以下命令:
g++ -g -c tinyxml2.cpp -o tinyxml2.o
g++ -g -c readxml.cpp -o readxml.og++ -g -o read_xml_test tinyxml2.o readxml.o
4.5 执行程序
执行程序:
./read_xml_test testXML.xml
执行结果如下所示:
可以看到,XML中的文件已经被成功读取。
五、示例代码下载
这里是以上测试代码文件(为了方便测试,补充了makefile文件和shell脚本)。
run_test.sh shell文件,清理当前目录,重新执行make命令,并运行代码
Makefile makefile文件,编译并链接项目
readxml.cpp XML解析测试源文件
tinyxml2.cpp TinyXML-2 源文件
tinyxml2.h TinyXML-2头文件testXML.xml 测试用xml文件
执行结果如下:
下载链接:
【免费】XML解析示例项目-读取并输出xml的指定内容示例资源-CSDN文库
六、函数的参数及功能
在tinyxml2.h 中,给出了函数的定义,功能及参数类型,可根据需求寻找与使用相应的函数。
如有不当或错误之处,恳请您的指正,谢谢!!!