使用Scrapy时出现虽然队列里有很多Request但是却不下载，造成假死状态

使用Scrapy时出现虽然队列里有很多Request但是却不下载，造成假死状态

news/2025/9/19 9:03:27/文章来源:https://blog.csdn.net/weixin_33730836/article/details/91881332

2019独角兽企业重金招聘Python工程师标准>>>

DOWNLOAD_TIMEOUT

Default: 180

The amount of time (in secs) that the downloader will wait before timing out.

Note

This timeout can be set per spider using download_timeoutspider attribute and per-request using download_timeoutRequest.meta key.

http://doc.scrapy.org/en/latest/topics/settings.html

--------------------------------------------------------------------------------------------------------------------------------------------------------------------------

现象就是：

程序运行一段时间，可能是几十分钟或者几个小时，然后后台日志里面就不出现下载页面的信息，一直显示上一分钟抓取了0个网页的信息。

刚开始已经猜到是某些下载线程没有正常执行回调方法引起程序一直以为线程还未下载完成，但是水平有限研究源码未果。

经过不停的google终于发现一个有价值的信息，是给twisted提出的一个bugfix

连接地址如下http://twistedmatrix.com/trac/attachment/ticket/5773/patch1.diff#L739

为client加上了超时的限制，一定时间内如果无响应则执行设定的超时回调。

我把里面的timeout=0改成了timeout=10

替换后在运行scrapy程序，问题不再出现

附件中为替换好的文件，下载后直接去掉文件后缀 .rar即可

_newclient.py.rar (53.7 KB)
下载次数: 48

client.py.rar (53.5 KB)
下载次数: 30

转载于:https://my.oschina.net/airship/blog/628765

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/news/285546.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

[转]maven与java命名规则

[转]maven与java命名规则

MAVEN 与 JAVA 包命名规范抛出问题在使用MAVEN搭建模块化项目时，我的组织结构如下： root模块文件夹名：package-module-project pom.xml文件： <project><groupId>com.chuillusion</groupId><artifactId>…

阅读更多...

为什么 Istio 要使用 SPIRE 做身份认证？

为什么 Istio 要使用 SPIRE 做身份认证？

今年 6 月初，Istio 1.14 发布 [1] ，该版本中最值得关注的特性是新增对 SPIRE 的支持。SPIFFE[2] 和 SPIRE 都是 CNCF 孵化项目，其中 SPIRE 是 SPIFFE 的实现之一。本文将带你了解 SPIRE 对于零信任架构的意义，以及 Istio 是为何使…

阅读更多...

C语言试题106之有一对兔子，从出生后第 3 个月起每个月都生一对兔子，小兔子长到第三个月后每个月又生一对兔子，假如兔子都不死，问每个月的兔子总数为多少？

C语言试题106之有一对兔子，从出生后第 3 个月起每个月都生一对兔子，小兔子长到第三个月后每个月又生一对兔子，假如兔子都不死，问每个月的兔子总数为多少？

1、题目题目：有一对兔子，从出生后第 3 个月起每个月都生一对兔子，小兔子长到第三个月后每个月又生一对兔子，假如兔子都不死，问每个月的兔子总数为多少？分析：兔子的规律为数列 1,1,2,3,5,8,13,21… 2 、温馨提示想获取更多C语言题目请猛搓这里==========》200个C语言…

阅读更多...

显式强制类型转换

显式强制类型转换

1. 日期显式转换为数字new Date; //1478845373322javascript有个奇特的语法，即构造函数没有参数时可以不用带()。不过最好还是使用ES5中新加入的静态方法：Date.now()。2. ~运算符按位运算符只适用于32位整数，运算符会强制操作数使用32位格式。…

阅读更多...

【ArcGIS风暴】ArcGIS Editor for OSM中文教程（2）：下载及加载OSM数据

【ArcGIS风暴】ArcGIS Editor for OSM中文教程（2）：下载及加载OSM数据

本文讲解在ArcGIS中借助OpenStreetMap工具下载并加载OSM数据。文章目录 1. 下载OSM数据2. 加载OSM数据1. 下载OSM数据在工具箱中双击Download OSM Data（XAPI）工具。 Download URL：http://www.overpass-api.de/api/xapi_meta? Downlaod Extent：与图层lanzhou相同

阅读更多...

Object.observe将不加入到ES7

Object.observe将不加入到ES7

先请看 Object.observe 的 API Object.observe(obj, callback[, acceptList])它用来监听对象的变化，当给该对象添加属性，修改属性时都会被依次记录下来看一个示例 var person {} Object.observe(person, function(arr) {var change arr[0]console.log…

阅读更多...

Kafka学习征途：.NET Core操作Kafka

Kafka学习征途：.NET Core操作Kafka

【Kafka】| 总结/Edison Zhou1可用的Kafka .NET客户端作为一个.NET Developer，自然想要在.NET项目中集成Kafka实现发布订阅功能。那么，目前可用的Kafka客户端有哪些呢？目前.NET圈子主流使用的是 Confluent.Kafkaconfluent-kafka-dotnet : htt…

阅读更多...

C语言试题107之判断 101至200 之间有多少个素数，并输出所有素数。

C语言试题107之判断 101至200 之间有多少个素数，并输出所有素数。

✅作者简介：大家好我是码莎拉蒂，CSDN博客专家🥇🥇🥇 📃个人主页：个人主页 🔥系列专栏：C语言试题200例 💬推荐一款模拟面试、刷题神器👉 点击跳转进入网站 1、题目题目：判断 101至200 之间有多少个素数，并输出所有素数分析：判断素数的方法：用一个数分…

阅读更多...

C语言将十进制输出二进制、八进制、十六进制的方法总结

C语言将十进制输出二进制、八进制、十六进制的方法总结

文章目录方法一：直接输出方法二：itoa函数方法一：直接输出 C语言中，控制printf函数输出格式的是格式字符，printf没有直接打出2进制数的格式符，直接打出16进制的格式符是x格式符，即%x。 printf函数中输出的格式为printf("<格式化字符串>", <参量表&…

阅读更多...

[Android] 修改ImageView的图片颜色

[Android] 修改ImageView的图片颜色

有两种方法： 方法1： ImageView imageView (ImageView) findViewById(R.id.arrow_image); Drawable tipsArrow imageView.getDrawable(); tipsArrow.setColorFilter(mContext.getResources().getColor(R.color.red_bg1), PorterDuf…

阅读更多...

四叉树算法

四叉树算法

2019独角兽企业重金招聘Python工程师标准>>> title: 四叉树算法 date: 2016-1-11 15:10 categories: IOS tags: 算法小小程序猿我的博客：http://daycoding.com 转载：http://blog.csdn.net/zhanxinhang/article/details/6706217 高德iOS聚合…

阅读更多...

2019年中国教育信息化行业研究报告

2019年中国教育信息化行业研究报告

2019年中国教育信息化行业研究报告教育行业丨研究报告本文转自：艾瑞咨询核心摘要： 教育信息化2.0时代，教育相关政府/学校以更开放的姿态对待社会各类业态的进入，共建共享优质教育资源，提升教育公平与教育质量。同…

阅读更多...

C语言试题109之将一个正整数分解质因数。例如：输入 90,打印出 90=2乘3乘3乘5

C语言试题109之将一个正整数分解质因数。例如：输入 90,打印出 90=2乘3乘3乘5

✅作者简介：大家好我是码莎拉蒂，CSDN博客专家🥇🥇🥇 📃个人主页：个人主页 🔥系列专栏：C语言试题200例 💬推荐一款模拟面试、刷题神器👉 点击跳转进入网站 1、题目题目：将一个正整数分解质因数。例如：输入 90,打印出 90=233*5。分析：对 n 进行分解质因…

阅读更多...

【ArcGIS遇上Python】使用add-in向导开发ArcGIS插件（1）：add-in工具介绍及安装

【ArcGIS遇上Python】使用add-in向导开发ArcGIS插件（1）：add-in工具介绍及安装

文章目录 addin介绍addin开发方式Python Add-In开发addin下载addin安装基于ArcObject/ArcGIS Engine的Add-In开发addin介绍 ArcGIS从10.0开始支持addin（ArcGIS软件中又叫作加载项）的方式进行插件制作。相对于以往9.x系列，addin的无论是从使用或者编写都更加方便快捷。通过开…

阅读更多...

dotnet 使用 Crossgen2 对 DLL 进行 ReadyToRun 提升启动性能

dotnet 使用 Crossgen2 对 DLL 进行 ReadyToRun 提升启动性能

我对几个应用进行严格的启动性能评估，对比了在 .NET Framework 和 dotnet 6 下的应用启动性能，非常符合预期的可以看到，在用户的设备上，经过了 NGen 之后的 .NET Framework 可以提供非常优越的启动性能，再加上 .NET Fr…

阅读更多...

使用myeclipse建立maven项目(重要)

使用myeclipse建立maven项目(重要)

maven是管理项目的，myeclipse是编写代码的。第一次写项目都要配置好多东西，很麻烦，now 来看看怎样新建一个maven项目。工具/原料 myeclipsemaven方法/步骤因为教程使用的maven是自己下载配置的，并没有使用myeclipse自带的&#…

阅读更多...

LeetCode 每日一题 Day 22 || 枚举(数学方法）/二分

LeetCode 每日一题 Day 22 || 枚举(数学方法）/二分

1954. 收集足够苹果的最小花园周长给你一个用无限二维网格表示的花园，每一个整数坐标处都有一棵苹果树。整数坐标 (i, j) 处的苹果树有 |i| |j| 个苹果。你将会买下正中心坐标是 (0, 0) 的一块正方形土地 ，且每条边都与两条坐标轴之一平行。给你…

阅读更多...

不用@微信官网了，用python给自己的微信头像加个小国旗

不用@微信官网了，用python给自己的微信头像加个小国旗

国旗LOGO（png透明格式）： 微信头像合成结果： import base64 import os import re from io import BytesIO from PIL import Image import tkinter as tk from tkinter import filedialog# 水印图片可以自己指定 #markImageImage…

阅读更多...

getContentResolver().query()方法selection参数使用详解（转）

getContentResolver().query()方法selection参数使用详解（转）

如何在managedQuery()和getContentResolver().query()方法中实现结果去重有时候，我们需要对查询的数据库结果进行去重。在SQL中我们可以通过distinct关键字实现，但是当我们使用android提供的managedQuery()或getContentResolver().query()方法对数据库进…

阅读更多...

C语言试题106之有一对兔子问题

C语言试题106之有一对兔子问题

✅作者简介：大家好我是码莎拉蒂，CSDN博客专家🥇🥇🥇 📃个人主页：个人主页 🔥系列专栏：C语言试题200例 💬推荐一款模拟面试、刷题神器👉 点击跳转进入网站 1、题目题目：有一对兔子，从出生后第 3 个月起每个月都生一对兔子，小兔子长到第三个月后每个月又…

阅读更多...

最新文章