pythonresponse对象的属性_Scrapy中response属性以及内容提取

pythonresponse对象的属性_Scrapy中response属性以及内容提取

news/2025/4/28 15:21:48/文章来源:https://blog.csdn.net/weixin_36403587/article/details/113499227

Python

Python开发

Python语言

Scrapy中response属性以及内容提取

一.属性

url ：HTTP响应的url地址,str类型

status：HTTP响应的状态码, int类型

headers ：HTTP响应的头部, 类字典类型, 可以调用get或者getlist方法对其进行访问

body：HTTP响应正文, bytes类型

text：文本形式的HTTP响应正文, str类型

response.text = response.body.decode(response.encoding)

encoding：HTTP响应正文的编码

reqeust：产生该HTTP响应的Reqeust对象

meta：即response.request.meta, 在构造Request对象时, 可将要传递给响应处理函数的信息通过meta参数传入, 响应处理函数处理响应时, 通过response.meta将信息提取出来

selector：Selector对象用于在Response中提取数据使用下面详细将,主要是 xpath,css取值之后的处理

xpath(query)：下面详细讲解

css(query) ：下面详细讲解

urljoin(url) ：用于构造绝对url, 当传入的url参数是一个相对地址时, 根据response.url计算出相应的绝对url.

二.Selector对象

Selector 对象和SelectorList对象都有以下几种方法。

extract() 返回选中内容的Unicode字符串

re("正则表达式") 正则提取

extract_first()(SelectorList独有)

返回列表中的第一个元素内容

re_first()(SelectorList独有)

返回列表中的第一个元素内容

三.CSS

response.css('css选择器')返回值是Selector对象

获取一个

response.css('css选择器').extract_first()

获取全部

response.css('css选择器').extract()

获取其中某个属性

response.css('css选择器::attr(属性名)').extract()

只要标签里的文本

(response.css('css选择器::text').extract()

四.xpath

response.css('xpath选择器')返回值是Selector对象

内容来源于网络，如有侵权请联系客服删除

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/news/295514.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

【转】学习apicloud和IOS之间的模块化使用

【转】学习apicloud和IOS之间的模块化使用

最近公司有使用APICloud发开的需求，需要我这边提供一些模块包得封装。因为没有也是刚接触APICloud，所以也就在看官方文档。下面讲一讲我再使用过程中得一点点东西。首先，下载官方SDK,下载最新版本的模块开发SDK，找到里面的Modul…

阅读更多...

豪横！学术圈“造假之王”，200余篇论文有183篇论文被撤稿

豪横！学术圈“造假之王”，200余篇论文有183篇论文被撤稿

全世界只有3.14 % 的人关注了爆炸吧知识导读：学术造假已经不再是什么新鲜话题，历史上的学术骗子也是数不胜数。其中骗子之王更是达到前无古人的地步，发表论文数212篇，因涉嫌造假而遭到撤稿的就达到了183篇之多。然而打假的过程并不…

阅读更多...

在CISCO ASA 防火墙上配置Web ×××

在CISCO ASA 防火墙上配置Web ×××

目前市场上产品很多，而且技术各异，就比如传统的 IPSec 来讲， SSL 能让公司实现更多远程用户在不同地点接入，实现更多网络资源访问，且对客户端设备要求低，因而降低了配置和运行支撑成本。很多企业用户采纳 …

阅读更多...

学Dapr Actors 看这篇就够了

学Dapr Actors 看这篇就够了

介绍Actor模式将Actor描述为最低级别的“计算单元”。换句话说，您在一个独立的单元（称为actor）中编写代码，该单元接收消息并一次处理一个消息，没有任何并发或线程。再换句话说，根据ActorId划分独立计算单元…

阅读更多...

博客园2013年5月份第1周源码发布详情

博客园2013年5月份第1周源码发布详情

媒体互动学习社区(课程设计)源码 2013-5-10 [VS2010]源码描述：该源码使用VS210SQL08开发，主要分为前台和后台，所有提交使用JQFORM提交，实现无刷新提高用户的体验，前台功能有学科的介绍，课件跟视频下载&…

阅读更多...

git之Pushing to the remote branch is not fast-forward错误解决

git之Pushing to the remote branch is not fast-forward错误解决

今天推送代码的时候报错了这个Pushing to the remote branch is not fast-forward,so the push has to be forced.The commits in the remote branch will be lost 错误，然后就出现这个效果，下面是图片。问题（Non-fast-forward）的…

阅读更多...

tp mysql索引_mysql索引

tp mysql索引_mysql索引

1 查看表中已存在哪些索引：show index from 表名；在添加索引之前最好先查看一下该表中已存在哪些索引：show index from 表名；1、主键索引注意： 主键索引一张表中只能有一个，但是可以添加多个索引比如&…

阅读更多...

CSS Id 和 Class

CSS Id 和 Class

2019独角兽企业重金招聘Python工程师标准>>> id 和 class 选择器如果你要在HTML元素中设置CSS样式，你需要在元素中设置"id" 和 "class"选择器。 id 选择器 id 选择器可以为标有特定 id 的 HTML 元素指定特定的样式。 HTML元素以id属…

阅读更多...

这4部有生之年必看的“教材级”纪录片，免费领取！

这4部有生之年必看的“教材级”纪录片，免费领取！

全世界只有3.14 % 的人关注了爆炸吧知识纪录片是以真实生活为创作素材，以真人真事为表现对象，并对其进行艺术的加工与展现的，以展现真实为本质，并用真实引发人们思考的电影或电视艺术形式。好的纪录片就像打开了一扇新世界的大门&…

阅读更多...

Dapr 集成 APISIX 做API网关

Dapr 集成 APISIX 做API网关

在这篇文章中，我将展示如何创建一个 APISIX控制器，该控制器在 Kubernetes 集群中公开启用 Dapr 的应用程序。本质上，APISIX控制器将配置相同的标准 Dapr annotations以注入daprd sidecar。通过公开这个 sidecar，它将允许外部应用程…

阅读更多...

判断一个字符串是否包含另一个字符串（用java但是不能用index()这个函数）

判断一个字符串是否包含另一个字符串（用java但是不能用index()这个函数）

目录：一.方法介绍二.图示意三.源代码一.方法介绍判断一个字符串str1是否包含另一个字符串str2： 1.取str2的第一个字符一次和str1的字符依次比较，知道找到相等的字符为止或者找完整个str1的length. 2.当找到相等的字符后，在str2长度内str2与str1依次进行比较二…

阅读更多...

mysql添加字段时定义候选键_MySQL 表约束

mysql添加字段时定义候选键_MySQL 表约束

约束概述对数据表中数据的限制条件叫表的约束，目的是为了保证表中记录的完整和有效。例如非空、唯一等。查看约束1 通过查看建表语句查看表中的约束show create table tb_name;2 通过检查约束表查看约束select * from information_schema.table_constraints where…

阅读更多...

跳槽9招让你“空降”任何企业都能成功

跳槽9招让你“空降”任何企业都能成功

2019独角兽企业重金招聘Python工程师标准>>> 作为一名职业经理人，没有谁没跳过槽，撇开在跳槽时对所“空降”的企业所需要的行业知识知根知底而“得心应手”，从而“稳定”外，其他人可能或多或少都有过因“不适应”新单位…

阅读更多...

这个年纪，喜欢你的肉体还会送你包的，原来是......

这个年纪，喜欢你的肉体还会送你包的，原来是......

1 iPhone 12一出王守义成最大赢家（素材来源网络，侵删）▼2 想搭免费车的喵（dy：大兔几）▼3 拼纹身的有吗？纹在我身，刀在你身▼4 那你泡啥？▼5 快把知识君p上去&#xff…

阅读更多...

Response. AppendHeader使用大全及文件下载.net函数使用注意点（转载）

Response. AppendHeader使用大全及文件下载.net函数使用注意点（转载）

Response. AppendHeader使用大全文件下载，指定默认名 Response.AddHeader(”content-type”,”application/x-msdownload”); Response.AddHeader(”Content-Disposition”,”attachment;filename要下载的文件名.rar”); 刷新页面 Response.AddHeader “REFRESH”, …

阅读更多...

C# WPF MVVM模式Caliburn.Micro框架下事件发布与订阅

C# WPF MVVM模式Caliburn.Micro框架下事件发布与订阅

01—前言处理同模块不同窗体之间的通信和不同模块之间不同窗体的通信，Caliburn提供了一种事件机制，可以在应用程序中低耦合的模块之间进行通信，该机制基于事件聚合器服务，允许发布者和订阅者之间通过事件进行通讯，且彼…

阅读更多...

mysql触发器 node_node.js中事件触发器events的使用

mysql触发器 node_node.js中事件触发器events的使用

node.js是基于事件驱动的，通过events，我们可以方便的创建事件，并通过触发事件来调用我们自定义的监听函数。所有能触发事件的对象都应该是 EventEmitter 类的实例，一般我们自定义一个类继承于 EventEmitter 类。通过on()方法我们可…

阅读更多...

Android之UI线程与子线程交互设计的5种方法

Android之UI线程与子线程交互设计的5种方法

转载地址：http://www.cr173.com/html/19165_1.html 在android的设计思想中，为了确保用户顺滑的操作体验。一些耗时的任务不能够在UI线程中运行，像访问网络就属于这类任务。因此我们必须要重新开启一个后台线程运行这些任务。然而，往往这些任务最终又会直接或者间接的需要访…

阅读更多...

svn: Can't open file '/a/b/db/txn-current-lock': Permission denied

svn: Can't open file '/a/b/db/txn-current-lock': Permission denied

SVN新建完版本库，在提交的时候报出如下错误 svn: Cant open file /a/b/db/txn-current-lock: Permission denied Permission denied svn: Cant make directory /a/b/dav/activities.d: Permission denied Permission denied 解决方法： chmod -R 755 /a/b…

阅读更多...

常用的加密算法---数字摘要

常用的加密算法---数字摘要

数字摘要：数字摘要也称为消息摘要，它是一个唯一对应一个消息或文本的固定长度的值，它是一个单向Hash函数对消息进行计算产生的。摘要生成的过程：待摘要串-----> Hash函数-----> 摘要消息摘要的特点：1.无论输入的…

阅读更多...

最新文章