post请求爬虫入门程序

<!--爬虫仅支持1.8版本的jdk-->
<!-- 爬虫需要的依赖-->
<dependency><groupId>org.apache.httpcomponents</groupId><artifactId>httpclient</artifactId><version>4.5.2</version>
</dependency><!-- 爬虫需要的日志依赖-->
<dependency><groupId>org.slf4j</groupId><artifactId>slf4j-log4j12</artifactId><version>1.7.25</version>
</dependency>

爬虫配置文件位置及存放位置

#爬虫日志配置文件 不写就报错
log4j.rootLogger=DEBUG,A1
log4j.logger.cn.itcast = DEBUG
log4j.appender.A1=org.apache.log4j.ConsoleAppender
log4j.appender.A1.layout=org.apache.log4j.PatternLayout
log4j.appender.A1.layout.ConversionPattern=%-d{yyyy-MM-dd HH:mm:ss, SSS} 【%t】 【%c】-【%p】 %m%n

实例代码

package day02;
import org.apache.http.HttpEntity;
import org.apache.http.client.methods.CloseableHttpResponse;
import org.apache.http.client.methods.HttpGet;
import org.apache.http.impl.client.CloseableHttpClient;
import org.apache.http.impl.client.HttpClients;
import org.apache.http.util.EntityUtils;import java.io.IOException;public class pacohngde {public static void main(String[] args) throws IOException {//注意这个方法是爬取网址所有位置//1.打开浏览器,创建Httpclient对象//        CloseableHttpclient httpclient = Httpclients.createDefault();CloseableHttpClient aDefault = HttpClients.createDefault();//2.输入网址，发起get请求创建HttpGet对象 输入你需要爬取的网址Httppost httpGet = new Httppost("https://zhuanlan.zhihu.com/p/98346518");//3.按回车，发起请求，返回响应，使用httpclient对象发起请求CloseableHttpResponse response = aDefault.execute(httpGet);//4.解析响应，获取数据//判断状态码是否是200     200为正常型号  其他为异常if(response.getStatusLine().getStatusCode()== 200){//获取爬取数据HttpEntity httpEntity =response.getEntity();//将爬取数据解析为utf-8格式String content = EntityUtils.toString(httpEntity,"utf-8");//打印System.out.println(content);
}

//释放资源
response.close();
//关闭网页
aDefault.close();}
}

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/news/796393.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

post请求爬虫入门程序

相关文章

知识融合与消歧：完善知识图谱的关键步骤

静态路由协议实验综合实验

打造你的专属云开发环境：支持任意 IDE，任意云服务 | 开源日报 No.215

python文件打包找不到文件路径

【Ubuntu20.04.6】VMWare Station 17安装Ubuntu20.04.6虚拟机系统

【Docker】搭建开源免费的书签管理系统 - OneNav

分享一个基于Multi-SLAM+3DGS的新一代三维内容生产技术

“进击的巨人”：服务器硬件基础知识解析

SystemC入门之测试平台编写完整示例：带同步输出的多路选择器

opencv+python（通道的分离与合并）笔记

c++:局部变量位置和全局变量位置的vector区别

微信小程序的页面交互2

c# wpf LiveCharts 简单试验2

LeetCode刷题之31.下一个排列

贪心算法|45.跳跃游戏II

go | gin 重定向路由重定向

网络安全之命令注入

【ARM 嵌入式 C 常用数据结构系列 25.1 -- linux 双向链表 list_head 使用详细介绍】

树莓派5使用体验

Python向带有SSL/TSL认证服务器发送网络请求小实践(附并发http请求实现asyncio+aiohttp)