python代理池好难啊_新人不会自己搭建代理池?快来引用大佬的

新人不会自己搭建代理池?快来引用大佬的

对于新人学习爬虫来说,虽然不会爬取太难的网站,但是有时候爬取的数据量过大的时候,也会遇到返回不了数据的问题,这时候打开网页一看.可能会看到"你的ip访问频率太高"这样的提示,出现这种问题的原因可能是,你被封ip啦.

但是爬虫不是还得继续不是吗?这时候就需要借助代理来突破自己ip访限制或者隐藏自己的ip来防止被封锁,关于代理则可以搭建代理池来解决,让网站防不胜防,但是都说了咱是新人!!!怎么会搭建代理池那玩意,这时候就需要像牛顿学习,站在巨人的肩膀上,借用他人的代理池来完成爬虫.

在这里我们借用了崔大写的开源代理池代理池地址 ,具体的运行方法崔大已经写好了,在这里我就想把自己运行这个代理池所遇到的问题做个总结

注:我在这里用的是windows系统.

1 关于代理池的下载前提

下载代理池 首先你需要创建一个github账号然后安装git,具体的流程请看git,因为git的安装在官网下载那简直是龟速,这里我分享我的网盘链接给大家,链接:https://pan.baidu.com/s/1gb6mPItCl9OLOAWSlryZMA

提取码:q1o4

(这个版本不是最新的)

2 关于代理池的下载

安装好git了我们打开cmd运行命令符,移动到想安装的盘,然后做出输入git clone https://github.com/Python3WebSpider/ProxyPool.git ,这样代理池就下载到本地啦,具体步骤如下图

3 关于运行所需要的条件

在这里我选择的是常规方式运行,没有用到docker,关于常规方式运行,需要满足以下条件

1.Python>=3.6

2. Redis

3. 安装依赖包

关于python的下载在这里推荐anaconda下载,安装最新的anaconda就好啦(虽然后面无法安装tensorflow,不过我们只爬虫的嘛),anaconda的安装教程地址是https://blog.csdn.net/weixin_43715458/article/details/100096496,当然如果你安装过anaconda或者python请略过这步,但是请确保你的python版本.后面打开代理池我用的是pycharam所以在这里在放一个链接关于anaconda安装与pycharm的配置anaconda与pycharm配置,啥都没有安装的请从次链接开始.

关于Redis的安装教程请参考此此链接Redis安装

另外redis常用的可视化工具 Redis Desktop Manager,但是0.9.4以上要给钱的,不过这里有免费的版本,链接redis可视化工具下载

关于依赖包的安装需要在虚拟环境下安装,这里我使用的是conda创建的虚拟环境,虚拟环境的安装请参考此链接conda安装虚拟环境,在这里继续强调你的python版本不能低于3.6,虚拟环境安装好了 请开启你的虚拟环境 然后移动到你代理池的文件位置,运行这个命令

pip3 install -r requirements.txt(安装了anaconda的命令为pip install -r requirements.txt),具体情况如下图所示

注:这里yu是我的虚拟环境名称 我已经安装好了依赖包了 这里做了个演示.

4 关于运行

关于运行其实也没啥好说的了,打开你的pycharm打开前面下载的代理池文件就好啦,这里对崔大写的一些做下解释,

关于这里 其实就在你的setting.py文件里的这里

你可以根据自己的情况进行修改,

关于这里

同样在setting.py文件里的

你可以根据自己的需要修改测试地址,构建专属于你所爬网站的代理池.

最后,打开你的 run.py文件点运行就能愉快的开启代理池啦.

原文链接:https://blog.csdn.net/weixin_48257295/article/details/107707037

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/393642.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

pat 1123(AVL)

题意:给n个数,按照顺序插入AVL,输出层次遍历,如果这颗AVL是完全二叉树,输出YES 否则输出NO 当时考试的时候。忘记AVL什么时候旋转了,数据结构不会写,感觉药丸 判断完全二叉树,这个简…

leetcode435. 无重叠区间(贪心算法)

给定一个区间的集合,找到需要移除区间的最小数量,使剩余区间互不重叠。 注意: 可以认为区间的终点总是大于它的起点。 区间 [1,2] 和 [2,3] 的边界相互“接触”,但没有相互重叠。 示例 1: 输入: [ [1,2], [2,3], [3,4], [1,3] ] 输出: 1 …

AMD规范(RequireJS)、CMD规范(SeaJS)、CommonJS(BravoJS)规范的辨析

首先,AMD,CMD,CommonJS都实现了文件模块化。 对于依赖的模块:AMD是提前执行;CMD是延迟执行; AMD是依赖前置,CMD是依赖就近; AMD官方解释:https://github.com/amdjs/amdjs…

客户旅程_我们进入微服务世界的旅程-以及从中学到的东西。

客户旅程by Ignacio Salazar Williams通过伊格纳西奥萨拉萨尔威廉姆斯(Ignacio Salazar Williams) 我们进入微服务世界的旅程-以及从中学到的东西。 (Our journey into the world of Microservices — and what we learned from it.) I know, I know everyone is talking abou…

英才计划计算机潜质测评试题,湖北省2020年“英才计划”潜质测试的通知

12月3日,湖北省青少年科技中心发布湖北省2020年“英才计划”潜质测试的通知,潜质测试分为笔试和机试两部分测试时间为2019年12月7日。各相关单位:根据《中国科协办公厅 教育部办公厅关于开展2020年“英才计划”工作的通知》(科协办发青字〔20…

leetcode1253. 重构 2 行二进制矩阵(贪心算法)

给你一个 2 行 n 列的二进制数组: 矩阵是一个二进制矩阵,这意味着矩阵中的每个元素不是 0 就是 1。 第 0 行的元素之和为 upper。 第 1 行的元素之和为 lower。 第 i 列(从 0 开始编号)的元素之和为 colsum[i],colsum…

Spring Cloud Config服务端配置细节(一)

上篇文章我们看了Spring Cloud中分布式配置中心的一个基本使用,这里边还涉及到许多细节,本文我们就来看看服务端配置中的一些细节。 本文是Spring Cloud系列的第二十三篇文章,了解前二十二篇文章内容有助于更好的理解本文: 1.使用…

POJ 1797 Heavy Transportation

传送门&#xff1a;http://poj.org/problem?id1797 不想吐槽了&#xff0c;弄了好久才AC 实现代码&#xff1a; #include <cstdio> #include <cstring> #include <algorithm> #include <vector> #include <cstdio> #include <iostream> u…

java8中方法区的内存大小如何设置_从Java8升级到Java11

奇技 指南为什么选择Java11?容器环境支持&#xff0c;GC等领域的增强&#xff0c;仅通过切换到 Java 11 就有 16&#xff05; 的改进。进行了瘦身&#xff0c;更轻量级&#xff0c;安装包体积小。JDK11 是一个长期支持版。1Java11相对于Java8的一些新特性1.变量类型推断Var关…

TCP建立连接

TCP的连接建立过程被称为三次握手:第一次握手&#xff1a;客户A的TCP向服务器B发出连接请求报文段,其首部中的同步位SYN 1 ,并选择序号seq x,表明传送| 数据时的第一 个数据字节的序号是X。第二次握手:B的TCP收到连接请求报文段后,如果同意,则发回确认。ACK1,其确认号ackx1。同…

webgl 着色器_如何使用AI,AR和WebGL着色器来帮助视障人士

webgl 着色器by Dan Ruta通过Dan Ruta 如何使用AI&#xff0c;AR和WebGL着色器来帮助视障人士 (How you can use AI, AR, and WebGL shaders to assist the visually impaired) Today, about 4% of the world’s population is visually impaired. Tasks like simple navigati…

计算机语言乍么设置,电脑如何设置语言

设置语言栏其实语言栏是用来进行输入法的切换的。当你需要在Windows中进行文字输入的时候,就需要用语言栏了,因为Windows的默认输入语言是英文,在这种情况下,你用键盘在文本里输入的文字会是英文字母,所以作为中国人的我们要想在Windows里输入中文的话,就需要语言栏的帮助了。试…

hive 初认识

结构Hive 是建立在hadoop上的数据仓库架构,它提供了一系列的工具,可以进行数据提取转换加载(这个过程叫做ETL),这是一种可以存储,查询和分析存储在hadoop中的大规模数据的机制.Hive定义了简单的类SQL查询语句 成为hql,他允许数据SQL的用户查询数据.同时 这个语言也允许数据mapr…

git使用(2)

1.远程仓库 a SSHKEY 第1步&#xff1a;创建SSH Key。在用户主目录下&#xff0c;看看有没有.ssh目录&#xff0c;如果有&#xff0c;再看看这个目录下有没有id_rsa和id_rsa.pub这两个文件&#xff0c;如果已经有了&#xff0c;可直接跳到下一步。如果没有&#xff0c;打开Shel…

邮件中的商务英语

一、常见缩写 CC carbon copy&#xff1a;抄送 FYI for your information&#xff1a;供你参考 EOD end of the day BTW By the way&#xff1a;顺便提一下 COB close of the business 这两个词都是指下班前。需要催促某人在下班前给到回复的时候可以用用它们。 eg: Ple…

vue 横向菜单滚动定位_使用vue组件+iscroll实现一个横向菜单,不能正确滑动

使用vue组件iscroll实现一个横向菜单&#xff0c;可是却不能滑动&#xff0c;给父元素ul写死一个宽度可以滑动。但是&#xff0c;我在computed里计算宽度&#xff0c;直接路由进去不能滑动&#xff0c;当我进入别的组件(切换路由)回来又可以滑动了示例地址&#xff1a;http://o…

leetcode1353. 最多可以参加的会议数目(贪心算法)

给你一个数组 events&#xff0c;其中 events[i] [startDayi, endDayi] &#xff0c;表示会议 i 开始于 startDayi &#xff0c;结束于 endDayi 。 你可以在满足 startDayi < d < endDayi 中的任意一天 d 参加会议 i 。注意&#xff0c;一天只能参加一个会议。 请你返…

计算机组成原理实验读r1,计算机组成原理实验一

计算机组成原理实验一 (5页)本资源提供全文预览&#xff0c;点击全文预览即可全文预览,如果喜欢文档就下载吧&#xff0c;查找使用更方便哦&#xff01;8.90 积分计算机组成原理实验计算机组成原理实验第一章、TEC-5 计算机组成实验箱简介运算器运算器74181通用寄存器通用寄存器…

如何使用Kotlin构建具有在线状态的Android Messenger应用

by Neo Ighodaro由新Ighodaro When building a chat application, it is essential to have an online presence feature. It is essential because your users will like to know when their friends are online, and are more likely to respond to their messages in real …

Spark常见问题解决办法

以下是在学习和使用spark过程中遇到的一些问题&#xff0c;记录下来。 1、首先来说说spark任务运行完后查错最常用的一个命令&#xff0c;那就是把任务运行日志down下来。 程序存在错误&#xff0c;将日志down下来查看具体原因!down日志命令&#xff1a;yarn logs -application…