一、Jsoup解析器快速入门案例
Docement对象,文本对象,包含着各个Dom树结构
1、引入Jsoup解析器的jar包放在lib文件夹下后,写java代码
其中,
二、Jsoup对象
1、Jsoup解析器解析xml和html的有关对象
其中,通过统计资源定位符URL解析HTML,适合爬虫,如比价网;
2、第一种通过获取的xml和html文件
3、第二种不常用,将html和xml静态页面的内容全部赋值到java代码中,会自动加上转义符\
4、第三种方式远程访问资源,通过资源同意定位符
三、Document对象
1、Document / Element,Document继承Element;
四、Element对象
1、Document / Element,Document继承Element;
其中,获取文本值时候标签不算,html()获取的包含标签和特殊符号<>;
五、Node节点对象,有很多get和set方法