java jsoup爬取动态网页_java通过Jsoup爬取网页(入门教程)

一，导入依赖

org.jsoup

jsoup

1.10.3

org.apache.httpcomponents

httpclient

二，编写demo类

注意不要导错包了,是org.jsoup.nodes下面的

package com.taotao.entity;

import org.apache.http.HttpEntity;

import org.apache.http.client.methods.CloseableHttpResponse;

import org.apache.http.client.methods.HttpGet;

import org.apache.http.impl.client.CloseableHttpClient;

import org.apache.http.impl.client.HttpClients;

import org.apache.http.util.EntityUtils;

import org.jsoup.Jsoup;

import org.jsoup.nodes.Document;

import org.jsoup.nodes.Element;

import org.jsoup.select.Elements;

import java.io.IOException;

/**

* Author: TaoTao 2019/9/26

public class intefaceTest {

public static void main(String[] args) throws IOException {

CloseableHttpClient httpClient = HttpClients.createDefault();//创建httpClient

HttpGet httpGet = new HttpGet("http://www.cnblogs.com/");//创建httpget实例

CloseableHttpResponse response = httpClient.execute(httpGet);//执行get请求

HttpEntity entity = response.getEntity();//获取返回实体

String content = EntityUtils.toString(entity,"utf-8");//网页内容

response.close();//关闭流和释放系统资源

Jsoup.parse(content);

Document doc = Jsoup.parse(content);//解析网页得到文档对象

Elements elements = doc.getElementsByTag("title");//获取tag是title的所有dom文档

Element element = elements.get(0);//获取第一个元素

String title = element.text(); //.html是返回html

System.out.println("网页标题："+title);

Element element1 = doc.getElementById("site_nav_top");//获取id=site_nav_top标签

String str = element1.text();

System.out.println("str:"+str);

}

标签：http,title,入门教程,jsoup,爬取,Jsoup,import,apache,org

来源： https://www.cnblogs.com/book-mountain/p/11595018.html

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/news/397605.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

java jsoup爬取动态网页_java通过Jsoup爬取网页(入门教程)

相关文章

Java设计模式之七大结构型模式

一个Option请求引发的深度解析

ionic+AnjularJs实现省市县三级联动效果

md5和SHA校验码

Confluence 6 附件存储文件系统的分级

Fragment与Activity交互(使用接口)

java保龄球计分_自己写的java保龄球记分

你不知道的JavaScript-0

真是，原来可以这样啊

1026. Table Tennis (30)

java运行时异常中文_JAVA——运行时异常（RuntimeException）

内置函数isinstance和issubclass

JavaOne 2016——首日亮点

指针数据类型 java_C/C++ 指针的小结——指针与其它数据类型（数组、字符串、函数、结构体）的关系...

Linux tr命令详解

512M内存编译php出错

Android中插件开发篇总结和概述

java反射机制路径_Java 反射机制详解

prop和attr在 jquery的

java传入数据库生成柱状图_Java读取数据库数据生成柱状图