dom4j使用介绍 xpath使用介绍 jsoup使用介绍
- 2016-03-20 21:45:00
- admin
- 原创 2027
一、dom4j使用介绍
XML,Extensible Markup Language,一种可扩展标记语言,主要由以下部分构成:
1、头部:用于申明版本和编码,<?xml version="1.0" encoding="UTF-8"?>
2、注释:可以输入任意字符, <!-- your comments -->
3、标记:即真正的内容;
4、CDATA:内容不被解析,用于放置特殊文本;
5、实体:用于申明特殊字符,或者给字符串取名;
dom4j使用介绍:
1、dom4j是xml常用解析库,jaxen是XPath查询库;
2、代码示例:XmlDemo.java、conf.xml、xmldemo.zip
依赖配置:
<dependency>
<groupId>org.dom4j</groupId>
<artifactId>dom4j</artifactId>
<version>2.1.4</version>
</dependency>
<dependency>
<groupId>jaxen</groupId>
<artifactId>jaxen</artifactId>
<version>2.0.0</version>
</dependency>
二、jsoup使用介绍
1、jsoup官方文档:https://jsoup.org
2、jsoup用于解析html,支持dom接口,支持xpath选择器;
3、Tag.preserveWhitespace()判断标签是否保留空白字符,比如textarea;
4、Tag.isBlock()判断标签是否块标签,br不是块标签,br需要单独判断;
5、StringUtil.normaliseWhitespace(String string)清除字符串多余空白字符;
6、代码示例:HtmlParser.java、htmldemo.zip
依赖配置:
<dependency>
<groupId>org.jsoup</groupId>
<artifactId>jsoup</artifactId>
<version>1.18.3</version>
</dependency>