DOM解析XML:Java程序员的“乐高积木式“数据搭建

各位代码建筑师们!今天我们要玩一个把XML变成内存乐高城堡的游戏——DOM解析!和SAX那种"边看监控边破案"的刺激不同,DOM就像把整个乐高说明书一次性倒进大脑,然后慢慢拼装(内存:你不要过来啊!)


一、DOM原理:XML的"克隆人战争"

想象你要复制整个迪士尼乐园:

  1. 全量加载术
    把XML文件整个吞进内存,变成一颗节点树(就像把城堡图纸转成3D模型)

  2. 随机访问特权
    可以随时瞬移到任意角落:“我要修改第三块砖的颜色!”(而SAX只能从头看到尾)

  3. 修改超能力
    支持增删改查,像玩《模拟人生》一样随意改造XML世界


二、实战演练:用DOM搭建"程序员主题乐园"

项目蓝图(programmer_park.xml):

<主题乐园 名称="996快乐谷"><区域 类型="代码深渊" geohash="wx4g0b1"><设施 id="1"><名称>无限续杯咖啡厅</名称><危险等级>★★★★☆</危险等级></设施><设施 id="2"><名称>需求变更过山车</名称><危险等级>★★★★★</危险等级></设施></区域>
</主题乐园>

建筑师工具包(DomArchitect.java):

import org.w3c.dom.*;
import javax.xml.parsers.*;
import javax.xml.transform.*;
import javax.xml.transform.dom.DOMSource;
import javax.xml.transform.stream.StreamResult;public class DomArchitect {public static void main(String[] args) throws Exception {// 装载整个乐园到内存DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();DocumentBuilder builder = factory.newDocumentBuilder();Document park = builder.parse("programmer_park.xml");// 打印所有危险设施NodeList rides = park.getElementsByTagName("设施");System.out.println("⚠️ 高危设施列表:");for (int i=0; i<rides.getLength(); i++) {Element ride = (Element) rides.item(i);String name = ride.getElementsByTagName("名称").item(0).getTextContent();String level = ride.getElementsByTagName("危险等级").item(0).getTextContent();System.out.println(name + " | 危险指数:" + level);}// 新增一个夺命设施Element newRide = park.createElement("设施");newRide.setAttribute("id", "3");Element name = park.createElement("名称");name.appendChild(park.createTextNode("Deadline蹦极台"));Element level = park.createElement("危险等级");level.appendChild(park.createTextNode("★★★★★★")); // 突破五星!newRide.appendChild(name);newRide.appendChild(level);park.getDocumentElement().getFirstChild().appendChild(newRide);// 保存修改后的乐园(小心内存泄漏!)Transformer transformer = TransformerFactory.newInstance().newTransformer();transformer.transform(new DOMSource(park), new StreamResult("programmer_park_modified.xml"));}
}

运行结果:

⚠️ 高危设施列表:
无限续杯咖啡厅 | 危险指数:★★★★☆
需求变更过山车 | 危险指数:★★★★★

(生成的新XML会多出一个"Deadline蹦极台",危险指数突破天际!)


三、DOM vs SAX:建筑师与侦探的巅峰对决

DOM建筑师 🏗️SAX侦探 🕵️♂️
内存消耗需要搬来整个建材市场(全量加载)只带侦探工具包(流式处理)
操作方式可以随意拆墙装修(随机修改)只能做现场记录(只读)
响应速度装修前要先运材料(初始化慢)到达现场立即开工(启动快)
适用场景需要改结构的精致小别墅快速搜查犯罪现场的超大仓库

四、DOM操作三大"骚操作"

  1. XPath闪电定位
    用XPath直接空降到指定节点,像使用传送门:

    XPath xpath = XPathFactory.newInstance().newXPath();
    Node node = (Node) xpath.evaluate("//设施[名称='需求变更过山车']", park, XPathConstants.NODE);
    
  2. 属性隐身术
    动态修改geohash坐标,让设施"瞬间移动":

    Element area = (Element) park.getElementsByTagName("区域").item(0);
    area.setAttribute("geohash", "wx4g0b9"); // 从深渊传送到厕所
    
  3. 节点克隆大法
    复制过山车并改名,省时省力:

    Node clonedRide = rides.item(1).cloneNode(true);
    ((Element)clonedRide).setAttribute("id", "4");
    clonedRide.getChildNodes().item(0).setTextContent("需求复活过山车");
    

五、DOM的致命陷阱

  1. 内存黑洞
    加载1GB的XML文件 ≈ 在内存里造航空母舰(小心OOM空袭!)

  2. 空白节点鬼打墙
    XML中的换行符会被视为Text节点,遍历时可能踩坑:

    // 错误示范:直接取第一个子节点可能是空白文本节点!
    // Element name = (Element) ride.getFirstChild();// 正确姿势:过滤文本节点
    NodeList children = ride.getChildNodes();
    for (int i=0; i<children.getLength(); i++) {if (children.item(i).getNodeType() == Node.ELEMENT_NODE) {Element child = (Element) children.item(i);// 处理真实节点}
    }
    
  3. 线程安全惊魂
    Document对象不是线程安全的!多个线程同时装修会拆了你的乐高城堡。


六、DOM哲学:内存即世界

  • 每个Element节点都是乐高积木
  • 每个Text节点都是积木上的贴纸
  • 每个Attribute都是积木的卡扣设计
  • 而内存溢出…是你野心太大想造死星的下场

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/75732.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Apache Nifi安装与尝试

Apache NIFI中文文档 地址&#xff1a;https://nifichina.github.io/ 下载安装配置 1、环境准备 Nifi的运行需要依赖于java环境&#xff0c;所以本机上需要安装java环境&#xff0c;并配置环境变量。 1.1查看本机是否已经存在java环境 请先执行以下命令找出系统中真实可用…

我可能用到的网站和软件

我可能用到的网站和软件 程序员交流的网站代码管理工具前端组件库前端框架在线工具人工智能问答工具学习的网站Windows系统电脑的常用工具 程序员交流的网站 csdn博客博客园 - 开发者的网上家园InfoQ - 软件开发及相关领域-极客邦掘金 (juejin.cn) 代码管理工具 GitHub 有时…

使用SSH解决在IDEA中Push出现403的问题

错误截图&#xff1a; 控制台日志&#xff1a; 12:15:34.649: [xxx] git -c core.quotepathfalse -c log.showSignaturefalse push --progress --porcelain master refs/heads/master:master fatal: unable to access https://github.com/xxx.git/: The requested URL return…

JavaScript异常机制与严格模式

目录 JavaScript 异常机制 1. 基本语法&#xff1a;try...catch...finally 2. 抛出异常&#xff1a;throw 3. 错误对象属性 4. 同步代码的异常处理 5. 异步代码的异常处理 5.1 回调函数 5.2 Promise 5.3 全局未捕获的 Promise 错误 6. 全局错误处理 7. 自定义错误与…

中厂算法岗面试总结

时间&#xff1a;2025.4.10 地点&#xff1a;上市的电子有限公司 面试流程&#xff1a; 1.由负责人讲解公司文化 2&#xff0c;由技术人员讲解公司的技术岗位&#xff0c;还有成果 3.带领参观各个工作位置&#xff0c;还有场所 4.中午吃饭 5.面试题&#xff0c;闭卷考试…

vue+flask图书知识图谱推荐系统

文章结尾部分有CSDN官方提供的学长 联系方式名片 文章结尾部分有CSDN官方提供的学长 联系方式名片 关注B站&#xff0c;有好处&#xff01; 编号: F025 架构: vueflaskneo4jmysql 亮点&#xff1a;协同过滤推荐算法知识图谱可视化 支持爬取图书数据&#xff0c;数据超过万条&am…

MySQL NDB Cluster详解

MySQL NDB Cluster&#xff08;MNC&#xff09; 是MySQL提供的一种分布式数据库解决方案&#xff0c;旨在提供高可用性、高性能的数据库服务。它通过 NDB&#xff08;Network DataBase&#xff09; 存储引擎实现了高可用性和分布式存储&#xff0c;在NDB中&#xff0c;数据通过…

解决华硕主板Z890m下载ubuntu20.04后没有以太网问题

问题描述&#xff1a; 华硕主板Z890m下载双系统ubuntu20.04后&#xff0c;发现ubuntu不能打开以太网。 问题原因&#xff1a; 华硕主板的网卡驱动是r8125,而ubuntu20.04的驱动版本是r8169&#xff0c;所以是网卡驱动不匹配造成 解决方案 开机界面按下F2进入BOIS模式&#…

JS里对于集合的简单介绍

JS的集合 前言一、集合二、基本使用1. 创建集合2. 添加元素3. 删除元素4. 检查元素5. 清空集合6. 集合的大小 三、扩展使用1. 遍历集合2. 从数组创建集合3. 集合的应用场景 四、总结 前言 JS里对于集合的简单介绍 同数学的集合&#xff0c;有无序性、唯一性 注意&#xff1a;…

pytorch 反向传播

文章目录 概念计算图自动求导的两种模式 自动求导-代码标量的反向传播非标量变量的反向传播将某些计算移动到计算图之外 概念 核心&#xff1a;链式法则 深度学习框架通过自动计算导数(自动微分)来加快求导。 实践中&#xff0c;根据涉及号的模型&#xff0c;系统会构建一个计…

Kotlin日常使用函数记录

文章目录 前言字符串集合1.两个集合的差集2.集合转数组2.1.集合转基本数据类型数组2.2.集合转对象数组 Map1.合并Map1.1.使用 操作符1.2.使用 操作符1.3.使用 putAll 方法1.4.使用 merge 函数 前言 记录一些kotlin开发中&#xff0c;日常使用的函数和方式之类的&#xff0c;…

详解正则表达式中的?:、?= 、 ?! 、?<=、?<!

1、?: - 非捕获组 语法: (?:pattern) 作用: 创建一个分组但不捕获匹配结果&#xff0c;不会将匹配的文本存储到内存中供后续使用。 优势: 提高性能和效率 不占用编号&#xff08;不会影响后续捕获组的编号&#xff09; 减少内存使用 // 使用捕获组 let regex1 /(hell…

【无标题】spark编程

Value类型&#xff1a; 9) distinct ➢ 函数签名 def distinct()(implicit ord: Ordering[T] null): RDD[T] def distinct(numPartitions: Int)(implicit ord: Ordering[T] null): RDD[T] ➢ 函数说明 将数据集中重复的数据去重 val dataRDD sparkContext.makeRDD(Lis…

GPT-2 语言模型 - 模型训练

本节代码是一个完整的机器学习工作流程&#xff0c;用于训练一个基于GPT-2的语言模型。下面是对这段代码的详细解释&#xff1a; 文件目录如下 1. 初始化和数据准备 设置随机种子 random.seed(1002) 确保结果的可重复性。 定义参数 test_rate 0.2 context_length 128 tes…

架构师面试(二十九):TCP Socket 编程

问题 今天考察网络编程的基础知识。 在基于 TCP 协议的网络 【socket 编程】中可能会遇到很多异常&#xff0c;在下面的相关描述中说法正确的有哪几项呢&#xff1f; A. 在建立连接被拒绝时&#xff0c;有可能是因为网络不通或地址错误或 server 端对应端口未被监听&#x…

HTTP实现心跳模块

HTTP实现心跳模块 使用轻量级的cHTTP库cpp-httplib重现实现HTTP心跳模块 头文件HttplibHeartbeat.h #ifndef HTTPLIB_HEARTBEAT_H #define HTTPLIB_HEARTBEAT_H#include <string> #include <thread> #include <atomic> #include <chrono> #include …

openharmony—release—4.1开发环境搭建(踩坑记录)

环境开发需要分别在window以及ubuntu下进行相应设置 一、window 1.安装DevEco Device Tool OpenAtom OpenHarmony 二、ubuntu 1.将Ubuntu Shell环境修改为bash ls -l /bin/sh 2.打开终端工具&#xff0c;执行如下命令&#xff0c;输入密码&#xff0c;然后选择No&#xff0…

Go学习系列文章声明

本次学习是基于B站的视频&#xff0c;【Udemy高分热门付费课程】Golang&#xff1a;完整开发者指南&#xff08;基础知识和高级特性&#xff09;中英文字幕_哔哩哔哩_bilibili 本人会尝试输出视频中的内容&#xff0c;如有错误欢迎指出 next page: Go installation process

error: RPC failed; HTTP 408 curl 22 The requested URL returned error: 408

在git push时报错&#xff1a;error: RPC failed; HTTP 408 curl 22 The requested URL returned error: 408 原因&#xff1a;可能是推送的文件太大&#xff0c;要么是缓存不够&#xff0c;要么是网络不行。 解决方法&#xff1a; 将本地 http.postBuffer 数值调整到500MB&…

Android.bp中添加条件判断编译方式

背景&#xff1a; 马哥学员朋友以前在vip群里&#xff0c;有问道如何在Android.bp中添加条件判断&#xff0c;在工作中经常需要一套代码兼容发货目标版本&#xff0c;即代码都是公共的一套&#xff0c;但是需要用这一套代码集成到各个产品设备上 但是这个产品设备可能面临比…