scrapy框架-post使用

 

scrapy中使用FormRequest向网页提交数据

Scrapy post使用

 

如何post data:

http://httpbin.org/post

 

FormRequest : post请求

GitHub Login

借助浏览器分析登陆行为。

  1. 分析post的内容
  2. 先尝试一次错误的登陆:
  3. 如下:分析:

需要post的数据有:

  1. token:
  2. utf-8:
  3. commit:
  4. login:
  5. password:
  6. 以上只有token不是固定的
  7. 将以上内容组装出来。

scrapy 如下:

# -*- coding: utf-8 -*-
import scrapy
from scrapy import FormRequest, Requestclass SpiderpostSpider(scrapy.Spider):name = "spiderpost"# allowed_domains = ["httpbin.org"]# starturls = 'http://httpbin.org/post'# "oSqXgiQ0dBFn5aNywI/BLkosYQKNlKd0K4QspnZP1HLLuA/ePxcjU0RItphFoIkOfySKiLQW27AKcmjLmqPmjQ=="# "wOgMHIwtyvdS1iwLG05afiq0/+gSkFr0RjS+x6f0nP/DALNvQiBVvuKsLRVMHfDJEtfNdTga2MdmYid0OcqxwQ=="starturls='https://github.com/login'loginurls='https://github.com/session'def start_requests(self):yield Request(self.starturls, callback=self.pre_parse)def pre_parse(self, response):# print(response.url)# passform =response.xpath('//form[@action="/session"]').extract()# print(form)keys=['utf8', 'authenticity_token', 'commit']values=[]for key in keys:xpath_ = '//form[@action="/session"]//input[@name="%s"]/@value'%keyvalue = response.xpath(xpath_).extract()[0]values.append(value)# print(values)postdata=dict(zip(keys,values))postdata['login'] = 'your nanme'postdata['password']='your password'# print(postdata)yield FormRequest(self.loginurls, formdata=postdata,callback=self.login_parse)def login_parse(self,response):# print(response.url)#检验是否登陆成功print(response.xpath('//meta[@name="user-login"]/@content').extract())

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/273954.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

duilib进阶教程 -- 改进窗口拖动 (12)

现在大家应该都知道caption"0,0,0,32",是指示标题栏区了吧,如果想要整个窗口都能拖动呢? 那直接把高度改成和窗口一样不就得了~O(∩_∩)O~ 嗯,这样是可以,比如窗口高度是600,那么我们指定caption…

python- 基础 range方法的使用

1、第一种用法 index[1,2,0,5,9,8,10,6,4,7] for i in range(len(index)): print(index[i]) 结果: λ py test.py 1 2 0 5 9 8 10 6 4 7 2、第二种用法: index[1,2,0,5,9,8,10,6,4,7] for i in range(0,len(index),2): print(index[i]) 运…

Oracle行列转换小结

目录结构如下:行转列列转行[一]、行转列 1.1、初始测试数据 表结构:TEST_TB_GRADE Sql代码 create table TEST_TB_GRADE ( ID NUMBER(10) not null, USER_NAME VARCHAR2(20 CHAR), COURSE VARCHAR2(20 CHAR), SCORE FLOAT ) 初始…

python- 进阶 与flask的搭配使用---定时任务框架APScheduler学习详解

APScheduler简介 在平常的工作中几乎有一半的功能模块都需要定时任务来推动,例如项目中有一个定时统计程序,定时爬出网站的URL程序,定时检测钓鱼网站的程序等等,都涉及到了关于定时任务的问题,第一时间想到的是利用ti…

Mingw下g++编译执行顺序错误

今天写一个简单的线性表时,用Mingw中的g编译、调试、运行时发现一个奇怪的现象:程序的执行顺序与实际编写顺序不一致。 编译环境:代码编写 win7下 editplus Mingw 4.3.3 g 代码片段如下: 1 //function: create a list 2 //ti…

python系统学习1-程序设计的基本方法

一、程序设计基本方法 计算机与程序设计 编译和解释 程序的基本编写方法 计算机编程 1、计算机与程序设计 (1)、计算机是根据指令操作数据的设备 功能性:对数据的操作、表现为数据计算、输出输入处理和结果存储。 可编程性:…

python 系统学习实例1.1 - 华氏度与摄氏度的转换

# C ( F - 32 ) / 1.8‪‬‪‬‪‬‪‬‪‬‮‬‫‬‭‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‮‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‮‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‫‬ # F C * 1.8 32‪‬‪‬‪‬‪‬‪‬‮‬‫‬‭‬‪‬‪‬‪‬‪‬‪‬‮‬‫…

EMS问题

如果EMS启动后在运行时报出 JMS error: "Not allowed to create destination这个错误,可能就是你启动方式的问题了进入到EMS的安装目录的bin目录下,运行tibemsca.bat那个文件就好使了。转载于:https://www.cnblogs.com/xiaotianyu/p/3421737.html

python 系统学习实例1.2 - 人民币与美元的转换

# RMB USD / 6.78‪‬‪‬‪‬‪‬‪‬‮‬‫‬‭‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‮‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‮‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‫‬ # USD RMB* 6.78 def tempConvert(): t input("请输入数值:") …

HDTV(1920x1080)码率和视频质量关系的研究 2 (实验结果)

上一篇文章中介绍了实验的准备工作, HDTV(1920x1080)码率和视频质量关系的研究 1 (前期准备) 本文介绍一下实验的结果。 首先来看一下主观评价的试验结果: 从实验结果来看,可以得出以下结论&…

python爬虫--如何爬取翻页url不变的网站

参考 https://blog.csdn.net/c350577169/article/details/80410133

POJ 1745 Divisibility DP

POJ:http://poj.org/problem?id1745 A完这题去买福鼎肉片,和舍友去买滴~舍友感慨“这一天可以卖好几百份,每份就算赚一块钱。。那么一个月。。一年。。。” 我说“那我们以后去卖这个吧,饿了还能自己煮着吃” 哈哈,一群天真的少…

NGUI如何创建自己的精灵图集

说实话其实很简单,但是在不知道的情况下真的不好弄啊. 1. 选择你要制作精灵图集的图片,可以选择多张 2. 提倡使用快捷键Alt Shift M 会有如下窗口弹出,也可以NGUI --> Open-->Atlas Maker打开 我们看到在Sprites里面就是我们选择的要制作图集的图片 当在Replace后面的输…

C++ - 进阶 1002

This time, you are supposed to find AB where A and B are two polynomials. Input Specification: Each input file contains one test case. Each case occupies 2 lines, and each line contains the information of a polynomial: K N​1​​ a​N​1​​​​ N​2​​…

修改6S Fortran77 代码,建立查找表

逐像元大气校正,常预先计算查找表(LUT,LookUp Tabel),6S大气辐射传输模式也可以用来计算LUT。但6S源程序输出信息多,且浮点数输出精度低,不利于提取关键信息生成LUT,本文描述了怎样修…

c++ 实例

#include "stdafx.h" #include <iostream> using namespace std; int main() { int a; a 4; cout<<a<<endl; return 0; }

VMware虚拟机与宿主无法复制的解决办法

由于工作需要&#xff0c;上网机器使用虚拟机&#xff0c;因此需要经常来回的拷贝文件&#xff0c;而vmware从6.5一直走来到10.0.1&#xff0c;总是有一个问题很让人苦恼---共享粘贴板总是会无故失效。经常实验&#xff0c;发现可以经过以下方法临时解决一下&#xff0c;虽然不…

c++ pat 乙级 --1001 害死人不偿命的(3n+1)猜想

1001 害死人不偿命的(3n1)猜想 &#xff08;15 分&#xff09; 卡拉兹(Callatz)猜想&#xff1a; 对任何一个正整数 n&#xff0c;如果它是偶数&#xff0c;那么把它砍掉一半&#xff1b;如果它是奇数&#xff0c;那么把 (3n1) 砍掉一半。这样一直反复砍下去&#xff0c;最后…

【开源项目之路】jquery的build问题

在刚开始clone了jquery到本地build的时候&#xff0c;就遇到了问题。 “ENORESTARGET No tag found that was able to satisfy ...” 提示为bower install失败&#xff0c;反复查找原因&#xff0c;最后在这儿看到同样类似的问题&#xff0c;貌似是git协议的连接问题&#xff0…

适配ios7

if ([self respondsToSelector:selector(edgesForExtendedLayout)]){self.edgesForExtendedLayout UIRectEdgeNone;self.extendedLayoutIncludesOpaqueBars NO;self.modalPresentationCapturesStatusBarAppearance NO;} 转载于:https://www.cnblogs.com/jiackyan/p/3441378.…