dom4j使用介绍 xpath使用介绍 jsoup使用介绍

2016-03-20 21:45:00
admin
原创 2027
摘要:dom4j使用介绍 xpath使用介绍 jsoup使用介绍

一、dom4j使用介绍

XML,Extensible Markup Language,一种可扩展标记语言,主要由以下部分构成:

1、头部:用于申明版本和编码,<?xml version="1.0" encoding="UTF-8"?>

2、注释:可以输入任意字符, <!-- your comments -->

3、标记:即真正的内容;

4、CDATA:内容不被解析,用于放置特殊文本;

5、实体:用于申明特殊字符,或者给字符串取名;


dom4j使用介绍:

1、dom4j是xml常用解析库,jaxen是XPath查询库;

2、代码示例:XmlDemo.javaconf.xmlxmldemo.zip


依赖配置:

<dependency>
    <groupId>org.dom4j</groupId>
    <artifactId>dom4j</artifactId>
    <version>2.1.4</version>
</dependency>
<dependency>
    <groupId>jaxen</groupId>
    <artifactId>jaxen</artifactId>
    <version>2.0.0</version>
</dependency>


二、jsoup使用介绍

1、jsoup官方文档:https://jsoup.org

2、jsoup用于解析html,支持dom接口,支持xpath选择器;

3、Tag.preserveWhitespace()判断标签是否保留空白字符,比如textarea;

4、Tag.isBlock()判断标签是否块标签,br不是块标签,br需要单独判断;

5、StringUtil.normaliseWhitespace(String string)清除字符串多余空白字符;

6、代码示例:HtmlParser.javahtmldemo.zip


依赖配置:

<dependency>
    <groupId>org.jsoup</groupId>
    <artifactId>jsoup</artifactId>
    <version>1.18.3</version>
</dependency>

发表评论
评论通过审核之后才会显示。