利用URL

2019独角兽企业重金招聘Python工程师标准>>> hot3.png

Problem

You have a HTML document that contains relative URLs, which you need to resolve to absolute URLs.

Solution

  1. Make sure you specify a base URI when parsing the document (which is implicit when loading from a URL), and

  2. Use the abs: attribute prefix to resolve an absolute URL from an attribute:

Document doc = Jsoup.connect("http://jsoup.org").get();Element link = doc.select("a").first();
String relHref = link.attr("href"); // == "/"
String absHref = link.attr("abs:href"); // "http://jsoup.org/"

Description

In HTML elements, URLs are often written relative to the document's location:<a href="/download">...</a>. When you use the Node.attr(String key) method to get a href attribute, it will be returned as it is specified in the source HTML.

If you want to get an absolute URL, there is a attribute key prefix abs: that will cause the attribute value to be resolved against the document's base URI (original location):attr("abs:href")

For this use case, it is important to specify the base URI when parsing the document.

If you don't want to use the abs: prefix, there is also a method Node.absUrl(String key) which does the same thing, but accesses via the natural attribute key.


转载于:https://my.oschina.net/u/553266/blog/296066

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/546344.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Win10安装DBeaver连接MySQL8、导入和导出数据库详细教程

一、DBeaver简介 ​ DBeaver 是一个基于 Java 开发&#xff0c;免费开源的通用数据库管理和开发工具&#xff0c;使用非常友好&#xff0c;且遵循ASL 协议。由于 DBeaver 基于 Java 开发&#xff0c;可以运行在各种操作系统上&#xff0c;比如Windows、Linux、macOS 等操作系统…

「视频版」当线程池溢出之后,程序会奔溃吗?面试突击 007 期

哈喽&#xff0c;大家好&#xff0c;我是老王&#xff0c;欢迎来到第 7 期的 Java 面试突击。本文的面试题是&#xff0c;当线程池的任务溢出之后&#xff0c;程序会奔溃吗&#xff1f;这个问题问的是关于线程池的任务数超过线程池的承载能力之后&#xff0c;会出现什么情况&am…

如何在python中获取浮点数的十六进制值?

浮点数的十六进制值 (Hexadecimal value of a float number) To get the hexadecimal value of a float number we use – float.hex() method, it accepts a float value and returns its hexadecimal value in string format. 要获取浮点数的十六进制值&#xff0c;我们使用–…

有人说:轻量级锁一定比重量级锁快!我忍不住笑了

世界上不止有黑白两色&#xff0c;黑与白之间还是灰色的地带。在成人的世界里&#xff0c;大多数人喜欢非黑即白的观点来看待一个问题&#xff0c;例如《十二公民》中那个刚开始所有人都认定的“一定是富二代杀S了自己的亲身父亲”&#xff0c;到最后大家理性分析和推测之后发现…

Python Django设计模式及模板层

一、Django的MTV模式 MTV代表Model - Template - View &#xff08;模型-模板-视图&#xff09;模式。 M模型层&#xff08;Model&#xff09;负责与数据交互。 T模板层&#xff08;Template&#xff09;负责呈现内容到浏览器。 V视图层&#xff08;View&#xff09;是核心&…

在Tomcat中配配置数据源汇总

为什么80%的码农都做不了架构师&#xff1f;>>> Tomcat本身不具备处理提供数据源的能力。借助于一些开源数据源实现&#xff0c;如&#xff1a;DBCP和C3P0等。 一、在http://commons.apache.org/可下载这些是Tomcat提供配置数据源所需的类库。 注意&#xff1a;Tom…

c 运算符##_C#程序演示关系运算符的示例

c 运算符##Relational operators are used to compare the values and returns Boolean values, if condition is true – they return True, otherwise they return False. 关系运算符用于比较值并返回布尔值(如果condition为true)-它们返回True &#xff0c;否则返回False 。…

Linux debian安装、配置和使用PuTTY教程

PuTTY是一个小巧、好用、免费的跨平台的访问Linux服务器的终端工具。PuTTY工具可以使用Telnet、SSH、rlogin、纯TCP以及串行接口连接服务器&#xff0c;使用非常广泛。本文主要介绍Debian系统如何安装PuTTY和如何设置该工具的字体、颜色。从而实现个性化定制自己的PuTTY工具&am…

Linux Debian安装FileZilla文件远程传输工具

一、FileZilla简介 FileZilla是一个快速、免费、跨平台的FTP软件&#xff0c;实用多功能和界面直观的FTP客户端。FileZilla是Windows&#xff0c;Linux&#xff0c;MacOSX等跨平台的图形化FTP&#xff0c;SFTP和FTPS文件管理工具。通过大量直观的工具&#xff0c;FileZilla可以…

Java 官方性能测试工具 JMH 简单入门

什么是 JMH JMH 是 Java Microbenchmark Harness 的缩写。中文意思大致是 “JAVA 微基准测试套件”。首先先明白什么是“基准测试”。百度百科给的定义如下&#xff1a; 基准测试是指通过设计科学的测试方法、测试工具和测试系统&#xff0c;实现对一类测试对象的某项性能指标…

Mybatis-Plus基础之Mapper查询

文章目录 一、简单查询二、 分页查询三、条件查询&#xff1a;WrapperWrapper 查询所有Wrapper 查询的 3 种写法一个复杂一点的例子 四、逻辑条件的组合与与和或或与或混用 五、条件为 null 的处理技巧六、设置查询列七、使用 SQL 聚合函数八、模糊查询 一、简单查询 // 根据 …

c# 赋值运算符_C#程序演示赋值运算符的示例

c# 赋值运算符Assignment operators (Assignment () and compound assignments (, -, *, /, %)) are used to assign the value or an expressions result to the left side variable, following are the set of assignment operators, 赋值运算符(Assignment( )和复合赋值( …

Linux Debian11使用国内源安装 Docker 环境

首先切换到root账户&#xff1a; su 一、Debian安装Docker 1.更新并安装一些必要系统工具。 sudo apt-get update sudo apt-get upgrade sudo apt-get install \apt-transport-https \software-properties-common \ca-certificates \curl \gnupg \lsb-release2.安装GPG证书…

HashMap 为什么在链表长度为 8 的时候转红黑树,为啥不能是 9 是 10?

这个问题是在面试某公司的时候面试官提的问题&#xff0c;当时没回答上来。归根到底还是因为自己复习基础的时候还不够仔细&#xff0c;也缺乏思考。 首先 我觉得需要确认一下&#xff0c;是不是随便什么情况下只要满足了链表长度为8就转红黑树呢&#xff1f;答案自然不是&am…

计算机网络怎么寻址_计算机网络中的无类寻址

计算机网络怎么寻址To reduce the wastage of IP addresses in blocks we subnetting. But in Classless addressing wastage of IP addresses in a block is more reduced than Classful subnetting. In this variable length, blocks are used that belongs to no class. 为了…

Linux Debian常用下载工具Transmission和qbittorrent

1.Transmission Transmission是Linux Debian系统下的系统自带的一种BitTorrent客户端下载工具&#xff0c;下载速度比较快。在Linux系统可以替代windows上的迅雷下载工具。 2.qbittorrent 使用下面命令安装&#xff1a; sudo apt-get install qbittorrent获取更多资料&#x…

《 面试又翻车了》这次竟然和 Random 有关?

小强最近面试又翻车了&#xff0c;然而令他郁闷的是&#xff0c;这次竟然是栽到了自己经常在用的 Random 上......面试问题既然已经有了 Random 为什么还需要 ThreadLocalRandom&#xff1f;正文Random 是使用最广泛的随机数生成工具了&#xff0c;即使连 Math.random() 的底层…

c#串口程序接收数据并打印_C#程序可打印各种数据类型的大小

c#串口程序接收数据并打印In this C# program – we are going to print size of various data types, to print size of a type, we use sizeof() operator. 在此C&#xff03;程序中–我们将打印各种数据类型的大小&#xff0c;并使用typeof()运算符打印类型的大小。 It acc…

Linux Debian11使用国内源安装Podman环境

一、Podman简介 Podman 是一个开源的容器运行时项目&#xff0c;可在大多数 Linux 平台上使用。Podman 提供与 Docker 非常相似的功能。正如前面提到的那样&#xff0c;它不需要在你的系统上运行任何守护进程&#xff0c;并且它也可以在没有 root 权限的情况下运行。 Podman 可…

二叉搜索树中第k大元素_二叉搜索树中第K个最小元素

二叉搜索树中第k大元素Problem statement: 问题陈述&#xff1a; Find the k-th smallest element in a given binary search tree (BST). 在给定的二进制搜索树(BST)中找到第k个最小的元素。 Example: 例&#xff1a; K4Kth smallest element in the above binary tree is:…