• 【Java 进阶篇】Java XML快速入门:理解、解析和生成XML


    在这里插入图片描述

    XML(可扩展标记语言)是一种常用于存储和交换数据的标记语言,而Java是一种强大的编程语言,它具有处理XML的能力。在本篇博客中,我们将探讨XML的基础知识,学习如何在Java中解析和生成XML文档,以及实际应用中如何处理XML数据。

    什么是XML?

    XML是一种标记语言,用于描述和存储数据。它的设计目标是可读性强、自解释、可扩展性好。XML文档包含标签、元素和属性,用于组织和描述数据。

    XML的主要特点包括:

    • 自解释性:XML文档通常包含有关数据的描述,标签和元素名称通常清晰表达数据的含义,使其易于理解。

    • 层次性:XML数据以层次结构的方式组织,可以包含嵌套元素,形成父子关系,非常适合表示树状结构的数据。

    • 可扩展性:用户可以自定义标签和规则,因此XML适用于各种领域,从配置文件到数据交换。

    • 与平台无关:XML是一种与编程语言和操作系统无关的格式,因此可以在不同平台上读取和解析XML数据。

    Java中的XML处理

    Java提供了丰富的工具和库来处理XML数据。主要的XML处理任务包括:

    1. 解析XML:将XML文档解析为Java对象,以便在应用程序中进行处理。
    2. 生成XML:将Java对象转换为XML文档,以便将数据存储为XML格式。
    3. 操作XML:对已解析的XML文档进行增、删、改、查等操作。

    接下来,我们将详细讨论如何在Java中执行这些任务。

    解析XML

    解析XML是将XML文档转换为Java对象的过程。Java提供了多种解析XML的方法,其中两种主要的是DOM解析和SAX解析。

    DOM解析

    DOM(文档对象模型)解析将整个XML文档加载到内存中,创建一个树状结构的文档对象模型。这种方式允许您以面向对象的方式访问和操作XML文档,但需要占用大量内存,因此不适合处理大型XML文件。

    以下是一个使用DOM解析XML的示例:

    import org.w3c.dom.*;
    import javax.xml.parsers.*;
    import java.io.*;
    
    public class DomParserExample {
        public static void main(String[] args) {
            try {
                File inputFile = new File("books.xml");
                DocumentBuilderFactory dbFactory = DocumentBuilderFactory.newInstance();
                DocumentBuilder dBuilder = dbFactory.newDocumentBuilder();
                Document doc = dBuilder.parse(inputFile);
                doc.getDocumentElement().normalize();
                NodeList bookList = doc.getElementsByTagName("book");
                for (int temp = 0; temp < bookList.getLength(); temp++) {
                    Node nNode = bookList.item(temp);
                    if (nNode.getNodeType() == Node.ELEMENT_NODE) {
                        Element eElement = (Element) nNode;
                        System.out.println("Title: " + eElement.getElementsByTagName("title").item(0).getTextContent());
                        System.out.println("Author: " + eElement.getElementsByTagName("author").item(0).getTextContent());
                        System.out.println("Price: " + eElement.getElementsByTagName("price").item(0).getTextContent());
                    }
                }
            } catch (Exception e) {
                e.printStackTrace();
            }
        }
    }
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18
    • 19
    • 20
    • 21
    • 22
    • 23
    • 24
    • 25
    • 26
    • 27

    在上面的示例中,我们使用DOM解析读取XML文件中的书籍信息。

    SAX解析

    SAX(简单API for XML)解析是一种事件驱动的解析方式,它逐行读取XML文档,触发事件来处理不同部分的数据。相比DOM,SAX解析占用较少内存,因此适合处理大型XML文件。

    以下是一个使用SAX解析XML的示例:

    import org.xml.sax.Attributes;
    import org.xml.sax.SAXException;
    import org.xml.sax.helpers.DefaultHandler;
    import javax.xml.parsers.*;
    import java.io.*;
    
    public class SaxParserExample {
        public static void main(String[] args) {
            try {
                File inputFile = new File("books.xml");
                SAXParserFactory factory = SAXParserFactory.newInstance();
                SAXParser saxParser = factory.newSAXParser();
                DefaultHandler handler = new DefaultHandler() {
                    boolean bTitle = false;
                    boolean bAuthor = false;
                    boolean bPrice = false;
    
                    public void startElement(String uri, String localName, String qName, Attributes attributes) throws SAXException {
                        if (qName.equalsIgnoreCase("title")) {
                            bTitle = true;
                        }
                        if (qName.equalsIgnoreCase("author")) {
                            bAuthor = true;
                        }
                        if (qName.equalsIgnoreCase("price")) {
                            bPrice = true;
                        }
                    }
    
                    public void characters(char ch[], int start, int length) throws SAXException {
                        if (bTitle) {
                            System.out.println("Title: " + new String(ch, start, length));
                            bTitle = false;
                        }
                        if (bAuthor) {
                            System.out.println("Author: " + new String(ch, start, length));
                            bAuthor = false;
                        }
                        if (bPrice) {
                            System.out.println("Price: " + new String(ch, start, length));
                            bPrice = false;
                        }
                    }
                };
                saxParser.parse(inputFile, handler);
            } catch (Exception e) {
                e.printStackTrace();
            }
        }
    }
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18
    • 19
    • 20
    • 21
    • 22
    • 23
    • 24
    • 25
    • 26
    • 27
    • 28
    • 29
    • 30
    • 31
    • 32
    • 33
    • 34
    • 35
    • 36
    • 37
    • 38
    • 39
    • 40
    • 41
    • 42
    • 43
    • 44
    • 45
    • 46
    • 47
    • 48
    • 49
    • 50

    在上面的示例中,我们使用SAX解析读取XML文件中的书籍信息。

    生成XML

    生成XML是将Java对象转换为XML文档的过程。Java提供了多种方式来生成XML,其中一种常用的方式是使用DOM库。

    以下是一个使用DOM库生成XML的示例:

    import org.w3c.dom.*;
    import javax.xml.parsers.*;
    import javax.xml.transform.*;
    import javax.xml.transform.dom.DOMSource;
    import javax.xml.transform.stream.StreamResult;
    import java.io.File;
    
    public class DomXmlWriterExample {
        public static void main(String[] args) {
            try {
                DocumentBuilderFactory dbFactory = DocumentBuilderFactory.newInstance();
                DocumentBuilder dBuilder = dbFactory.newDocumentBuilder();
                Document doc = dBuilder.newDocument();
    
                // 创建根元素
                Element rootElement = doc.createElement("bookstore");
                doc.appendChild(rootElement);
    
                // 创建书籍元素
                Element bookElement = doc.createElement("book");
                rootElement.appendChild(bookElement);
    
                // 创建标题元素
                Element titleElement = doc.createElement("title");
                titleElement.appendChild(doc.createTextNode("Java编程入门"));
                bookElement.appendChild(titleElement);
    
                // 创建作者元素
                Element authorElement = doc.createElement("author");
                authorElement.appendChild(doc.createTextNode("小明"));
                bookElement.appendChild(authorElement);
    
                // 创建价格元素
                Element priceElement = doc.createElement("price");
                priceElement.appendChild(doc.createTextNode("29.99"));
                bookElement.appendChild(priceElement);
    
                // 将文档写入XML文件
                TransformerFactory transformerFactory = TransformerFactory.newInstance();
                Transformer transformer = transformerFactory.newTransformer();
                DOMSource source = new DOMSource(doc);
                StreamResult result = new StreamResult(new File("new_books.xml"));
                transformer.transform(source, result);
    
                System.out.println("XML文件已生成!");
            } catch (Exception e) {
                e.printStackTrace();
            }
        }
    }
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18
    • 19
    • 20
    • 21
    • 22
    • 23
    • 24
    • 25
    • 26
    • 27
    • 28
    • 29
    • 30
    • 31
    • 32
    • 33
    • 34
    • 35
    • 36
    • 37
    • 38
    • 39
    • 40
    • 41
    • 42
    • 43
    • 44
    • 45
    • 46
    • 47
    • 48
    • 49
    • 50

    在上面的示例中,我们创建了一个新的XML文档,并使用DOM库构建XML结构,然后将文档写入名为 “new_books.xml” 的文件。

    操作XML

    除了解析和生成XML,Java还提供了操作XML文档的能力。您可以使用DOM或其他库来遍历、修改和查询XML数据。

    以下是一个使用DOM库操作XML的示例:

    import org.w3c.dom.*;
    import javax.xml.parsers.*;
    import java.io.*;
    
    public class DomXmlModifierExample {
        public static void main(String[] args) {
            try {
                File inputFile = new File("books.xml");
                DocumentBuilderFactory dbFactory = DocumentBuilderFactory.newInstance();
                DocumentBuilder dBuilder = dbFactory.newDocumentBuilder();
                Document doc = dBuilder.parse(inputFile);
                doc.getDocumentElement().normalize();
    
                // 获取根元素
                Element root = doc.getDocumentElement();
    
                // 添加新书籍
                Element newBook = doc.createElement("book");
                Element title = doc.createElement("title");
                title.appendChild(doc.createTextNode("新书标题"));
                Element author = doc.createElement("author");
                author.appendChild(doc.createTextNode("新书作者"));
                Element price = doc.createElement("price");
                price.appendChild(doc.createTextNode("19.99"));
                newBook.appendChild(title);
                newBook.appendChild(author);
                newBook.appendChild(price);
                root.appendChild(newBook);
    
                // 修改现有书籍
                NodeList bookList = doc.getElementsByTagName("book");
                for (int temp = 0; temp < bookList.getLength(); temp++) {
                    Node bookNode = bookList.item(temp);
                    if (bookNode.getNodeType() == Node.ELEMENT_NODE) {
                        Element bookElement = (Element) bookNode;
                        if (bookElement.getElementsByTagName("title").item(0).getTextContent().equals("Java编程入门")) {
                            Element newPrice = doc.createElement("price");
                            newPrice.appendChild(doc.createTextNode("25.00"));
                            bookElement.appendChild(newPrice);
                        }
                    }
                }
    
                // 删除书籍
                NodeList bookListToRemove = doc.getElementsByTagName("book");
                for (int temp = 0; temp < bookListToRemove.getLength(); temp++) {
                    Node bookNode = bookListToRemove.item(temp);
                    if (bookNode.getNodeType() == Node.ELEMENT_NODE) {
                        Element bookElement = (Element) bookNode;
                        if (bookElement.getElementsByTagName("title").item(0).getTextContent().equals("新书标题")) {
                            root.removeChild(bookNode);
                        }
                    }
                }
    
                // 将文档写回XML文件
                TransformerFactory transformerFactory = TransformerFactory.newInstance();
                Transformer transformer = transformerFactory.newTransformer();
                DOMSource source = new DOMSource(doc);
                StreamResult result = new StreamResult(new File("modified_books.xml"));
                transformer.transform(source, result);
    
                System.out.println("XML文件已修改!");
            } catch (Exception e) {
                e.printStackTrace();
            }
        }
    }
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18
    • 19
    • 20
    • 21
    • 22
    • 23
    • 24
    • 25
    • 26
    • 27
    • 28
    • 29
    • 30
    • 31
    • 32
    • 33
    • 34
    • 35
    • 36
    • 37
    • 38
    • 39
    • 40
    • 41
    • 42
    • 43
    • 44
    • 45
    • 46
    • 47
    • 48
    • 49
    • 50
    • 51
    • 52
    • 53
    • 54
    • 55
    • 56
    • 57
    • 58
    • 59
    • 60
    • 61
    • 62
    • 63
    • 64
    • 65
    • 66
    • 67
    • 68

    在上面的示例中,我们打开一个XML文件,然后添加新书籍、修改现有书籍和删除书籍,最后将文档写回到XML文件中。

    实际应用示例

    让我们来看一个实际的应用示例:使用Java解析RSS订阅。RSS是一种常见的数据格式,用于发布博客文章、新闻等内容。我们可以使用Java解析并显示RSS订阅中的文章标题和链接。

    首先,创建一个RSS订阅文件 rss_feed.xml,并添加一些文章项:

    
    <rss version="2.0">
        <channel>
            <title>示例RSS订阅title>
            <link>http://example.com/rsslink>
            <description>这是一个示例RSS订阅description>
            <item>
                <title>文章1标题title>
                <link>http://example.com/article1link>
            item>
            <item>
                <title>文章2标题title>
                <link>http://example.com/article2link>
            item>
        channel>
    rss>
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16

    接下来,我们可以编写Java代码来解析并显示RSS订阅的文章:

    import org.w3c.dom.*;
    import javax.xml.parsers.*;
    import java.io.*;
    
    public class RssReaderExample {
        public static void main(String[] args) {
            try {
                File inputFile = new File("rss_feed.xml");
                DocumentBuilderFactory dbFactory = DocumentBuilderFactory.newInstance();
                DocumentBuilder dBuilder = dbFactory.newDocumentBuilder();
                Document doc = dBuilder.parse(inputFile);
                doc.getDocumentElement().normalize();
    
                Element channel = (Element) doc.getElementsByTagName("channel").item(0);
                System.out.println("订阅标题: " + channel.getElementsByTagName("title").item(0).getTextContent());
                System.out.println("订阅链接: " + channel.getElementsByTagName("link").item(0).getTextContent());
                System.out.println("订阅描述: " + channel.getElementsByTagName("description").item(0).getTextContent());
                System.out.println("文章列表:");
    
                NodeList items = doc.getElementsByTagName("item");
                for (int i = 0; i < items.getLength(); i++) {
                    Element item = (Element) items.item(i);
                    System.out.println("标题: " + item.getElementsByTagName("title").item(0).getTextContent());
                    System.out.println("链接: " + item.getElementsByTagName("link").item(0).getTextContent());
                    System.out.println("---------------");
                }
            } catch (Exception e) {
                e.printStackTrace();
            }
        }
    }
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18
    • 19
    • 20
    • 21
    • 22
    • 23
    • 24
    • 25
    • 26
    • 27
    • 28
    • 29
    • 30
    • 31

    在上面的示例中,我们解析了一个包含文章标题和链接的RSS订阅文件,并将这些信息显示在控制台上。

    总结

    本篇博客介绍了XML的基础知识,以及如何在Java中解析和生成XML文档。我们了解了两种常见的XML解析方法:DOM解析和SAX解析,以及如何使用DOM库操作XML文档。我们还探讨了一个实际应用示例,演示了如何使用Java解析RSS订阅。

    XML在数据交换、配置文件、Web服务和许多其他领域中都有广泛的应用。掌握XML处理技术对于Java开发人员来说非常重要,因为它允许他们有效地处理和交换数据。希望本篇博客对您理解Java中的XML处理提供了有用的信息,使您能够在自己的项目中应用这些知识。无论您是初学者还是有经验的开发人员,都可以从中受益,掌握XML处理的基本技能。

    作者信息

    作者 : 繁依Fanyi
    CSDN: https://techfanyi.blog.csdn.net
    掘金:https://juejin.cn/user/4154386571867191
  • 相关阅读:
    14:00面试,14:06就出来了,问的问题过于变态了。。。
    行政人事的日常丨每个人心里都有一团火
    Tungsten Fabric Rabbitmq故障处理
    93.(cesium之家)cesium动态单体化-倾斜摄影(楼栋)
    阿里巴巴、阿里云Java面试题、笔试题(含答案)
    从 async 和 await 函数返回值说原理
    文件批量重命名 Renamer 最新中文 for mac
    JavaScript DOM基础
    ssm冬奥会志愿者报名系统毕业设计源码241154
    pg 创建分区表 --chatGpt
  • 原文地址:https://blog.csdn.net/qq_21484461/article/details/133981178