【转载保存】Jsoup解析html常用方法

首先我们要清楚 class的继承关系

Document 继承于  Element  继承于 Node  继承于 Object

首先 我们先研究一下 Element 中的函数作用:

01 addClass(String className)   --> 添加一个class名字 到这个元素的class属性上.

02 after(Node node)  --> 将指定的节点添加到当前Element的后面

03 after(String html) --> 指定的html加添到当前Element的后面

04 append(String html) --> 添加这个html到这个元素中

05 appendChild(Node child)  --> 添加一个子节点到这个元素.

06 appendElement(String tagName) --> 创建一个有标签名的新元素,并添加到最后一个节点.

07 appendText(String text)  --> 创建和添加一个新的文本节点到这个元素.

08 attr(String attributeKey , String attributeValue) 在这个元素中设置一个属性值.

09 before(Node node) 将此节点添加到当前元素的前面

10 before(String html) 将此html字符串添加到当前元素的前面

11 child(int index)  通过索引 定位到子元素.

12 children() 获取这个元素的所有子孩子

13 className()  获取这个元素的class属性的名字

14 classNames() 获取所有元素的class名字 返回值: Set

15 classNames(Set classNames ) 通过提供的class名字来设置元素的class属性

16 clone()  克隆

17 data()  获取这个元素的结合数据

18 elementSiblingIndex()  获取当前元素在他的兄弟列表中的索引 (返回值是Integer)

19 empty() 移除这个元素的所有孩子数据节点.

20 firstElementSibling() 获取当前元素 同一级别的第一个兄弟元素.

21 getAllElements() 拿到当前元素下的所有元素 ( 包括 自己 , 孩子 , 孩子的孩子)

22 getElementById(String id)  通过id属性找到元素

23 getElementsByAttribute(String key)  通过属性名称 查找当前html下的所有元素

24 getElementsByAttributeStarting(String keyPrefix)  查找当前元素下 , 所有以String 开头的字符串 属性名称的所有集合

25 getElementsbyAttributeValue(String key , String value) 通过属性和属性值, 获取所有元素.

26 getElementsByAttributeValueContaining(String key , String match) 通过属性和属性值(属性值可以模糊查询) 获取所有元素

27 getElementsByAttributeValueEnding(String key , String end) 通过属性和属性值(已String结尾的值) 查询所有元素

28 getElementsByAttributeValueMatching(String key, Pattern pattern) 通过属性值得正则表达式来查询所有元素

29 getElementsByAttributeValueNot(String key, String value) 查询属性值不是我们提供的属性值的所有元素

30 getElementsByAttributeValueStarting(String key, String valuePrefix)  通过查询已valuePrefix的属性值开始的所有元素

31 getElementsByClass(String className)  当前元素是否有此class 或者在这个元素下面是否有这个class

32 getElementsByIndexEquals(int index) 查找当前元素同一级别的元素索引和提供的index相同的元素.

33 getElementsByIndexGreaterThan(int index) 查找同一级别元素索引大于当前索引的所有元素.

34 getElementsByIndexLessThan(int index)  查找同一级别元素索引小于当前索引的所有元素.

35 getElementsByTag(String tagName) 查找当前元素或者当前元素之下的相同标签的元素.

36 getElementsContainingOwnText(String searchText) 查找当前元素直接包含的文本内容的元素

37 getElementsContainingText(String searchText) 查找当前元素包含的文本String

38 getElementsMatchingOwnText(Pattern pattern) 查找当前元素直接包含的文本的正则表达式

39 getElementsmatchingText(Pattern pattern) 查找当前元素下 包含文本的正则表达式

40 hasClass(String className)  通过class属性名字来查找所有元素

41 boolean   hasText()  测试 当前元素下是否有一些文本

42 html() 检索文件内的Html

43 id() 返回当前元素的id值

44 insertChildren(int index , Collection<? extends Node> children)  在元素指定的位置, 插入子孩子

45 isBlock()  测试这个元素是不是层级元素

46 lastElementSibling() 获取这个元素的同一级别元素的最后一个

47 nextElementSubling() 获取这个元素的同一级别元素的下一个

48 nodeName() 标签名字

49 ownText() 获取到当前元素的文本 , 而不是子孩子的文本

50 parent() 获取这个节点的父节点

51 prepend(String html)  添加这个html到这个元素

52 parents() 获取到父节点 ,一直到节点的根节点

53 prependChild(Node child)  添加一个节点到子节点开始位置

54 prependElement(String tarName)  创建一个新的节点 , 并且作为第一个子节点

55 PrependText(String text)  创建和前置一个新的文本节点到这个元素

56 previousElementSibling() 获取到当前元素的上一个元素

57 removeClass(String className)  把当前元素的class属性删除

58 select()  选择器方法 , 万能的

59 siblingElements() 获取所有的兄弟元素(不包含自己)

60 返回值 Tag  tag() 获取这个标签对象

61 tagName() 获取这个标签的名字

62 tagName(String tagName)  改变这个标签名字

63 text() 获取这个元素和所有孩子的文本内容

64 textNodes() 获取这个元素的孩子文本标签集合

65 toggleClass(String className)  如果元素有当前参数的 class属性名 , 删除它  .如果没有 添加它

66 val() …

67  wrap()  包装这个元素的html


作者:动吉
来源:CSDN
原文:https://blog.csdn.net/zhangboy1234/article/details/38893955
版权声明:本文为博主原创文章,转载请附上博文链接!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/509147.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Unity打包失败解决方案

更改设置即可 &#xff1a;Edit -> Graphics Emulation-> Shader Hardware Tier 1

【转载保存】接口的压力测试工具

https://blog.csdn.net/luosaosao/article/details/72900072

Unity3D实现谷歌数字地球

Unity3D实现谷歌地球 在Unity3d平台实现的类似谷歌地球的功能&#xff0c;可动态加载谷歌&#xff0c;ArcGis,BingMap,天地图影像&#xff0c;也可加载国界线等矢量文件以及在线加载高程文件。 视频链接: 地球操作:https://www.bilibili.com/video/BV1mT4y1P771 地球漫游:h…

Unity下载安装网址

https://unity.cn/releases

【转载保存】java牛逼的开源项目汇总

http://blog.longjiazuo.com/archives/2625?hmsrtoutiao.io&utm_mediumtoutiao.io&utm_sourcetoutiao.io

Unity罗技方向盘接入

要想在Unity中接入罗技方向盘的数据&#xff0c;首先必须安装驱动&#xff0c;并且打开安装的软件&#xff0c;否则在Unity中会一直连接不成功。状态如下&#xff1a; 然后下载相应的开发包Logitech SDK即可&#xff0c;需要替换相应的LogitechSteeringWheelEnginesWrapper.dll…

sscanf

sscanf&#xff08;&#xff09; 2010-01-28 11:53:42| 分类&#xff1a; Work|举报|字号 订阅 下载LOFTER我的照片书 |定义函数 int sscanf (const char *str,const char * format,........); 函数说明 sscanf()会将参数str的字符串根据参数format字符串来转换并格…

【转载保存】网页提取正文算法汇总

正文抽取算法&#xff1a; 1.Html2Article &#xff1a;http://www.cnblogs.com/jasondan/p/3497757.html 2.基于行块分布函数的网页正文抽取算法代码实现https://blog.csdn.net/leiguang55555/article/details/51959646 源码下载: https://blog.csdn.net/red4711/article/deta…

ModBus协议寄存器

ModBus有四种数据&#xff0c;DI、DO、AI、AO DI: 数字输入&#xff0c;离散输入&#xff0c;一个地址一个数据位&#xff0c;用户只能读取它的状态&#xff0c;不能修改。比如面板上的按键、开关状态&#xff0c;电机的故障状态。 DO: 数字输出&#xff0c;线圈输出&#xf…

字典树

微博:TankyWoo基新博客:TankyWooTanky Woo的前博客 字典树&#xff08;讲解模版&#xff09; 又称单词查找树&#xff0c;Trie树&#xff0c;是一种树形结构&#xff0c;是一种哈希树的变种。典型应用是用于统计&#xff0c;排序和保存大量的字符串&#xff08;但不仅限于字符串…

Unity3D谷歌地球

Unity3D实现谷歌地球 在Unity3d平台实现的类似谷歌地球的功能&#xff0c;可动态在线加载谷歌&#xff0c;ArcGis,BingMap,天地图等影像&#xff0c;也可加载国界线等矢量文件以及在线加载高程文件。 视频链接: 地球操作:https://www.bilibili.com/video/BV1mT4y1P771 地球…

【转载保存】获取页面编码

https://blog.csdn.net/u010061897/article/details/9116879

Unity OnTriggerEnter不调用

Unity OnTriggerEnter不调用需要在对象上添加Rigidbody组件&#xff01;

jsoup的Elements类

一、简介 该类是位于select包下&#xff0c;直接继承自Object&#xff0c;所有实现的接口有Cloneable, Iterable, Collection, List 类声明&#xff1a;public class Elements extends Object implements List, Cloneable 可以使用Element.select(String) 方法去得到Element…

线段树的操作

登录 | 注册 MetalSeed 思绪来得快去的也快&#xff0c;偶尔会在这里停留。 目录视图摘要视图订阅 移动信息安全的漏洞和逆向原理 程序员11月书讯&#xff0c;评论得书啦 Get IT技能知识库&#xff0c;50个领域一键直达数据结构专题——线段树 标签&#xff1a; …

UnrealEngine4 - 关于UObject被自动GC垃圾回收的巨坑

1 出现的问题 在一个插件中新建了一个静态的继承于UObject的对象 static UMyObject* m_Object nullptr; 1 然后在插件的蓝图函数中对其进行了初始化: m_Object NewObject<UMyObject>(); 1 过了一段时间之后发现这个对象被析构&#xff0c;导致野指针&#xff0c;造成…

【转载保存】Java+Selenium使用

环境搭建&#xff1a;https://blog.csdn.net/u011541946/article/details/72898514 环境搭建问题解决&#xff1a;https://blog.csdn.net/u010366748/article/details/72872190 package server;import java.util.concurrent.TimeUnit;import org.openqa.selenium.By; import o…

UE4加载osgb倾斜摄影数据

在UE4引擎中动态加载调度osgb倾斜摄影数据&#xff0c;利用多线程动态加载瓦片数据&#xff0c;可以顺畅加载海量的瓦片数据。最大可加载200G以上数量级。 Unity3D加载osgb倾斜摄影数据:Unity3d(UE4)动态加载osgb倾斜摄影数据_Answer-3的博客-CSDN博客_unity加载osgb qq:1749…

相对路径转成绝对路径

public static String getAbsoluteURL(String baseURI, String relativePath) {String abURL null;try {URI base new URI(baseURI);// 基本网页URIURI abs base.resolve(relativePath);// 解析于上述网页的相对URL&#xff0c;得到绝对URIURL absURL abs.toURL();// 转成U…

Unity/UE读取OPC UA和OPC DA数据(UE4)

Unity/UE4通过OPC UA和OPC DA协议读取PLC数据&#xff0c;通过采集服务将数据采集到数据库中&#xff0c;Unity3d和UE4再从数据库中读取数据进行展示&#xff0c;用于三维数字孪生系统接入自动化系统的硬件数据。支持WinCC,组态王&#xff0c;Kepware等组态软件的数据接入。 W…