Java 爬取网页

news/2025/4/20 14:30:21/文章来源:https://blog.csdn.net/weixin_45743799/article/details/105602458

我们使用 net.URL 类的 URL() 构造函数来抓取网页

代码如下

import java.io.BufferedReader;
import java.io.BufferedWriter;
import java.io.FileWriter;
import java.io.InputStreamReader;
import java.net.URL;public class Main {public static void main(String[] args) throws Exception {URL url = new URL("http://www.baidu.com");BufferedReader reader = new BufferedReader(new InputStreamReader(url.openStream()));BufferedWriter writer = new BufferedWriter(new FileWriter("test.html"));String line;while ((line = reader.readLine()) != null) {System.out.println(line);writer.write(line);writer.newLine();}reader.close();writer.close();}
}

结果输出

<!DOCTYPE html> <html> <head> <meta charset="UTF-8"/> <meta http-equiv="X-UA-Compatible" content="IE=11,IE=10,IE=9,IE=8"/>……

在这里插入图片描述

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/news/563932.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

Java 获取 URL响应头的日期信息

我们用 HttpURLConnection 的 httpCon.getDate() 方法来获取 URL响应头的日期信息代码如下 import java.net.HttpURLConnection; import java.net.URL; import java.util.Date;public class Main{public static void main(String args[]) throws Exception {URL url new UR…

Java 获取 URL 响应头信息

我们如何获取指定 URL 的响应头信息呢？ 代码如下 import java.io.IOException; import java.net.URL; import java.net.URLConnection; import java.util.Map; import java.util.Set;public class Main {public static void main(String[] args) throws IOExcepti…

Java 解析URL

使用 net.URL 类的 url.getProtocol() ,url.getFile() 等方法来解析 URL 地址完整代码 import java.net.URL;public class Main {public static void main(String[] args) throws Exception {URL url new URL("http://www.baidu.com/html/html-tutorial.html");S…

MySql 服务名无效

当我们安装好MySql之后进行启动的时候，我们会发现提示我们服务名无效，那么我们应该如何解决这个问题呢？ 如果出现了服务名无效我们要知道这是因为我们的MySql服务没有安装。错误提示： 解决办法 1 . 进入MySql的安装目录的bin…

Navicat 连接Mysql 报错1251

我们在使用navicat链接mysql的时候有时会出现错误1251-Client does not support authentication protocol requested by server； 错误显示解决办法 1 . 管理员方式打开cmd。 2.以root用户登录MySQL。命令：mysql -u root -p （ 注意&…

Git安装详细步骤

下载安装Git 1 . 下载Git， 官方下载地址：https://git-scm.com/download/win 根据自己的电脑选择32位或者64位操作系统进行下载。 2 . 等待下载完毕，双击进行安装。 3 . 选择软件安装目录，可以使用默认目录也可以指定安装目录。…

Git clone的使用方法

使用Git clone项目 1 . 首先我们要确保我们的电脑上已经安装Git。桌面点击右键出现如下图所示的两个Git即Git已经安装。 2 . 在电脑的任意一个磁盘里新建一个本地文件夹作为clone项目的保存文件夹。 3 . 在码云上面打开我们要clone的项目。 4 . 点击克隆/下载按钮出现项目…

remote: Incorrect username or password ( access token )

remote: Incorrect username or password ( access token ) 在使用Git进行项目的clone的时候最后一步出现了这个错误，错误的意思是用户名或者密码不正确。错误截图解决办法 1 . 打开控制面板 ，点击用户账户。 2 . 点击管理 Windows 凭据 3 . 找到…

Connection to @localhost failed. [08001] Could not create connection to database server. Attempt

Connection to localhost failed. [08001] Could not create connection to database server. Attempt 当我们使用IDEA的database连接Mysql数据库的时候会出现这个错误。解决办法首先要保证我们的路径账户密码啥的都没有问题。在数据库路径后面添加 ?serverTimezoneGM…

IDEA通过Database连接MySql数据库

我们如何使用IDEA通过里面的Database连接MySQL数据库的呢？ 详细步骤 1 . 打开我们的IDEA，右边的侧边栏有Database，点击Database。 2 . 点击 --> Data Source --> MySql。 3 . 填写MySql数据库的用户名和密码以及要链接的数据库名称…

PyCharm 设置背景图片

好看的编译器能使我们愉快的完成编码工作，那么我们能不能给我们的编译器设置一个背景图片的呢？？？ 详细步骤 1 . 打开我们的PyCharm, File --> Settings。 2 . Apperence --> Background Image …。 3 . 选择背景图片的路…

PyCharm 安装插件

PyCharm安装插件详细教程 1 . 首先打开我们的PyCharm，File --> Setting。 2 . 选择plugins。 3 . 在搜索栏里搜索插件，点击右边的绿色Instail进项插件的下载安装。 4 . 选择Accept。 5 . 点击右边的绿色Restart IDE。 6 . Restart（重…

JAVA.SQL.SQLNONTRANSIENTCONNECTIONEXCEPTION: COULD NOT CREATE CONNECTION TO DATABASE SERVER. ATTEMPT

错误信息 java.sql.SQLNonTransientConnectionException: Could not create connection to database server. Attempted reconnect 3 times. Giving up.at com.mysql.cj.jdbc.exceptions.SQLError.createSQLException(SQLError.java:108) ~[mysql-connector-java-8.0.11.jar:8…