• Jsoup解析XML文件


    1.方法介绍

    DOM树方式:

            操作为:获取Document对象,获取对应的标签Element对象,获取数据

    代码为:

    1. String path = JsoupDemo.class.getClassLoader().getResource("studnet.xml").getPath();
    2. //获取xml文件路径
    3. Document document = Jsoup.parse(new File(path), "utf-8");
    4. 解析文件并加载至内存中获取DOM树
    5. Elements elements = document.getElementsByTag("name");
    6. //获取元素对象 Element
    7. System.out.println(elements.size());
    8. Element element = elements.get(0);
    9. //获取第一个name的Element对象
    10. String name = element.text();
    11. //获取数据
    12. System.out.println(name);

    快捷查询方式:
            通过Xpath确定文档中所需位置,遍历获取所需信息

    代码为:

    1. String path = JsoupDemo6.class.getClassLoader().getResource("student.xml").getPath();
    2. //获取student.xml的path
    3. Document document = Jsoup.parse(new File(path), "utf-8");
    4. //获取Document对象
    5. JXDocument jxDocument = new JXDocument(document);
    6. //根据document对象,创建JXDocument对象
    7. //结合xpath语法查询
    8. //查询所有student标签
    9. List jxNodes = jxDocument.selN("//student");
    10. for (JXNode jxNode : jxNodes) {
    11. System.out.println(jxNode);
    12. }
    13. System.out.println("--------------------");
    14. //查询所有student标签下的name标签
    15. List jxNodes2 = jxDocument.selN("//student/name");
    16. for (JXNode jxNode : jxNodes2) {
    17. System.out.println(jxNode);
    18. }
    19. System.out.println("--------------------");
    20. //查询student标签下带有id属性的name标签
    21. List jxNodes3 = jxDocument.selN("//student/name[@id]");
    22. for (JXNode jxNode : jxNodes3) {
    23. System.out.println(jxNode);
    24. }
    25. System.out.println("--------------------");
    26. //查询student标签下带有id属性的name标签 并且id属性值为itcast
    27. List jxNodes4 = jxDocument.selN("//student/name[@id='itcast']");
    28. for (JXNode jxNode : jxNodes4) {
    29. System.out.println(jxNode);
    30. }

     

    2.解析时会出现的问题

    常见状况为:
    String path = JsoupDemo.class.getClassLoader().getResource("studnet.xml").getPath();

    编译器在该处报错,报错信息为:Exception in thread "main" java.lang.NullPointerException: Cannot invoke "java.net.URL.getPath()" because the return value of "java.lang.ClassLoader.getResource(String)" is null

    即提供的路径无法获取xml文件

    此时需要检查xml文件所在路径中是否包含空格,编译器在遇见空格时会将其转编成"%20",导致无法获取正确路径,出现编译失败的情况.对应方案为在getPath()前加上toURI方法,将空格转回来.

    若次上述方法无效则需查看项目类型,若项目类型为maven web则查看该句:

    String path=FileUtil.class.getClassLoader().getResource("resources/table.xml");

    尝试将"resources/"删除,原因是resources目录下存放的资源文件经过编译后直接放到了项目根目录下

    若依然无效:请查看xml文件名与获取路径处的文件名是否相同.

  • 相关阅读:
    日常梳理-常用注解
    编程小白的自学笔记十五(python办公自动化操作EXCEL表格)
    Jenkins 安装全攻略:从入门到精通
    location rewrite
    guava本地缓存CacheLoader使用
    「专升本信息技术」信息技术基础知识习题(1)
    [Qualcomm][Voice Call]语音通话流程和问题分析
    C/C++内存管理
    电路的基本原理
    王道考研--》顺序表课后习题C语言代码实现(冲刺)
  • 原文地址:https://blog.csdn.net/galaxy_stella/article/details/126159031