Jsoup从一个文件加载一个文档

在我们的磁盘里有一个HTML文件,我们需要对它进行解析从中抽取数据或进行修改。

使用静态 Jsoup.parse(File in, String charsetName, String baseUri) 方法:

File input = new File("/file/input.html");
Document doc = Jsoup.parse(input, "UTF-8", "http://baidu.com/");

解说
A:
parse(File in, String charsetName, String baseUri) 这个方法用来加载和解析一个HTML文件。如在加载文件的时候发生错误,将抛出IOException,应作适当处理。
B:
baseUri 参数用于解决文件中URLs是相对路径的问题。如果不需要可以传入一个空的字符串。
C:
另外还有一个方法parse(File in, String charsetName) ,它使用文件的路径做为 baseUri。 这个方法适用于如果被解析文件位于网站的本地文件系统,
    且相关链接也指向该文件系统。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/565403.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【OpenCV 例程200篇】210. 绘制直线也会有这么多坑?

OpenCV 例程200篇 总目录 【youcans 的 OpenCV 例程200篇】210. 绘制直线也会有这么多坑? 我不是标题党。 绘制直线当然是最简单的绘图,能有什么坑呢?不信的同学可以直接跳到注意事项。就算你是 OpenCV 大神,如果这 10 个问题点…

PHP配置微信测试号,关于微信开发模式和测试账号

自己刚开始学习微信开发,请帮忙解惑1.微信公众号使用模式分为编辑模式和开发者模式 ,两个是互斥的,也就是开启一个另一个就不能用现在我的理解 上边两个模式是由服务器的开启停用区分的,启用即为开发者模式另外,我想知…

Jsoup使用DOM方法来遍历一个文档

要从一个HTML文档要从中提取数据,并了解这个HTML文档的结构需要先将HTML解析成一个Document之后,然后使用类似于DOM的方法进行操作。 File input new File("/file/input.html"); Document doc Jsoup.parse(input, "UTF-8", "…

【OpenCV 例程200篇】211. 绘制垂直矩形

OpenCV 例程200篇 总目录 【youcans 的 OpenCV 例程200篇】211. 绘制垂直矩形 7.1 绘图函数基本参数 OpenCV提供了绘图功能,可以在图像上绘制直线、矩形、圆、椭圆等各种几何图形。 函数 cv.line()、cv.rectangle()、cv.circle()、cv.polylines() 等分别用来在图…

php自动采集入库,Phpcms v9自动采集入库自动发布组件

Phpcms v9自动采集入库自动发布组件是思优CMSYOU技术团队在实际SEO运维运用总结研究出的自动采集入库自动发布文章的组件,实现自动通过Phpcms后台采集模块的采集规则采集文章、并自动入库到对应栏目、入口后自动更新生成内容页自身HTML、栏目页HTML、首页HTML&#…

Jsoup使用选择器语法来查找元素

如果你想使用类似于CSS或jQuery的语法来查找和操作元素,我们可以使用Element.select(String selector) 和 Elements.select(String selector) 方法实现: File input new File("html path"); Document document Jsoup.parser(input, "U…

【OpenCV 例程200篇】212. 绘制倾斜的矩形

OpenCV 例程200篇 总目录 【youcans 的 OpenCV 例程200篇】212. 绘制倾斜的矩形 7.1 绘图函数基本参数 OpenCV提供了绘图功能,可以在图像上绘制直线、矩形、圆、椭圆等各种几何图形。 函数原型: 函数 cv.rectangle() 用来在图像上绘制垂直于图像边界的…

java注释的理解,java注解原理——记录一下自己的理解

最近因为系统可能要更换成java语言,于是每天都在拼命的研究java的相关知识和框架。之前学习注解的时候,没有太深入的去理解它,只是觉得标注一下挺好用,但是现在在学到spring aop的时候,突然发现注解的功能是如此强大。…

Jsoup从元素中抽取属性 文本和HTML

在解析获得一个Document实例对象,并查找到一些元素之后,我们如何取得在这些元素中的数据呢??? 使用Jsoup抽取属性,一般方法如下: 1.要取得一个属性的值,可以使用Node.attr(String k…

CSDN 技能树使用体验与产品分析(1)

文章目录1. 什么是技能树2. 技能树的产品结构3. 技能树的使用3.1 产品入口3.2 知识点的模块设置3.3 『练习题』模块3.4 『参考资料』模块3.5 『讨论区』与『笔记』模块4. 结束语C 站近期隆重推出了一个新产品『技能树』,这是一个很好的方向。 很早就想写一篇介绍和…

【OpenCV 例程200篇】213. 绘制圆形

OpenCV 例程200篇 总目录 【youcans 的 OpenCV 例程200篇】213. 绘制圆形 7.1 绘图函数基本参数 OpenCV提供了绘图功能,可以在图像上绘制直线、矩形、圆、椭圆等各种几何图形。 7.3 绘制圆形 函数原型: 函数 cv.circle() 用来在图像上绘制圆形。 cv…

Jsoup处理URLs

我们在处理HTML内容时,可能经常会遇到这种问题,需要将html页面里面的链接地址从相对地址转换成绝对地址,如何使用Jsoup来解决这个问题呢? 方法 在你解析文档时确保有指定base URI,然后 使用 abs: 属性前缀来取得包含b…

matlab的fft点数,matlab fft的点数问题

看完下面的,也许你会明白点The FFT functions (fft, fft2, fftn, ifft, ifft2, ifftn) are based on a library called FFTW [3],[4]. To compute an N-point DFT when N is composite (that is, when NN1N2), the FFTW library decomposes the problem using the C…

【OpenCV 例程200篇】214. 绘制椭圆的参数详解

OpenCV 例程200篇 总目录 【youcans 的 OpenCV 例程200篇】214. 绘制椭圆的参数详解 OpenCV提供了绘图功能,可以在图像上绘制直线、矩形、圆、椭圆等各种几何图形。 7.4 绘制椭圆 函数原型: 函数 cv.ellipse() 用来在图像上绘制椭圆轮廓、填充椭圆、椭…

mysql外键猫头,SQL进阶

SQL进阶1.约束之主键约束非空、唯一、被引用当表的某一列被指定为主键之后,该列就不能为空,不能有重复值出现。创建表时指定主键的两种方式:CREATE TABLE stu1(sid CHAR(6) PRIMARY KEY,sname VARCHAR(20),age INT,gender VARCHAR(10));指定s…

Jsoup获取所有链接

从一个URL获得一个页面。然后提取页面中的所有链接、图片和其它辅助内容。并检查URLs和文本信息。 运行下面程序需要指定一个URLs作为参数 package org.jsoup.examples;import org.jsoup.Jsoup; import org.jsoup.helper.Validate; import org.jsoup.nodes.Document; import …

【OpenCV 例程200篇】215. 基于多段线绘制近似椭圆

OpenCV 例程200篇 总目录 【youcans 的 OpenCV 例程200篇】215. 基于多段线绘制近似椭圆 如果需要对椭圆渲染进行更多控制,或者绘制粗略的椭圆边界,可以使用 cv.ellipse2Poly 检索曲线,然后使用多段线进行渲染或使用fillPoly进行填充。 函数…

【OpenCV 例程200篇】216. 绘制多段线和多边形

专栏地址:『youcans 的 OpenCV 例程200篇』 文章目录:『youcans 的 OpenCV 例程200篇-总目录』 【youcans 的 OpenCV 例程200篇】216. 绘制多段线和多边形 函数 cv.polylines() 用来绘制多边形曲线或多段线。 函数 cv.fillPoly() 用来绘制一个或多个填充…

Jsoup设置属性值

在处理html时,我们有时候可能想在解析一个Document之后修改其中的某些属性值,如图片地址、class名称等各种属性,然后再保存到磁盘或都输出到前台页面。 可以使用属性设置方法 Element.attr(String key, String value), 和 Elements.attr(St…

matlab mat文件 太大,MATLAB .mat文件中的开销过大

这对我来说似乎是个错误.解决方法是以块的形式写入预分配的数组.从预先分配开始:fid fopen(01_hit12.par, r);data fread(fid, inf, uint8);nlines nnz(data 10) 1;fclose(fid);matObj.moleculeNumber zeros(1,nlines,uint8);matObj.isotopeologueNumber zer…