有时候我们可能希望通过一个url地址,然后提取里面的内容,转换成document对象。
用 Jsoup.connect(String url)方法:
Document doc = Jsoup.connect("http://baidu.com/").get();
String title = doc.title();
解说
connect(String url) 方法创建一个新的 Connection, 和 get() 取得和解析一个HTML文件。如果从该URL获取HTML时发生错误,便会抛出 IOException,应适当处理。
Connection 接口还提供一个方法链来解决特殊请求,具体如下:
Document doc = Jsoup.connect("http://baidu.com";).data("query", "Java").userAgent("Mozilla").cookie("auth", "token").timeout(3000).post();
这个方法只支持Web URLs (http和https 协议); 假如你需要从一个文件加载,可以使用 parse(File in, String charsetName) 代替。