python抓包代码_Python抓包并解析json爬虫的完整实例代码

Python抓包并解析json爬虫FwA免费资源网

在使用Python爬虫的时候,通过抓包url,打开url可能会遇见以下类似网址,打开后会出现类似这样的界面,无法继续进行爬虫:FwA免费资源网

FwA免费资源网

例如:FwA免费资源网

需要爬取网页中第二页的数据时,点击F12➡网络(Network)➡XHR,最好点击清除键,如下图:FwA免费资源网

FwA免费资源网

通过点击“第二页”,会出现一个POST请求(有时会是GET请求),点击POST请求的url,(这里网址以POST请求为例),FwA免费资源网

如图:FwA免费资源网

FwA免费资源网

然后复制参数代码FwA免费资源网

代码展示:FwA免费资源网

import requests

import json

url = 'https://m.ctrip.com/restapi/soa2/13444/json/getCommentCollapseList?_fxpcqlniredt=09031130211378497389'

header={

'authority': 'm.ctrip.com',

'method': 'POST',

'path': '/restapi/soa2/13444/json/getCommentCollapseList?_fxpcqlniredt=09031130211378497389',

'scheme': 'https',

'accept': '*/*',

'accept-encoding': 'gzip, deflate, br',

'accept-language': 'zh-CN,zh;q=0.9',

'cache-control': 'no-cache',

'content-length': '278',

'content-type': 'application/json',

'cookie': '__utma=1.1986366783.1601607319.1601607319.1601607319.1; __utmz=1.1601607319.1.1.utmcsr=(direct)|utmccn=(direct)|utmcmd=(none); _RSG=blqD1d4mGX0BA_amPD3t29; _RDG=286710759c35f221c000cbec6169743cac; _RGUID=0850c049-c137-4be5-90b7-0cd67093f28b; MKT_CKID=1601607321903.rzptk.lbzh; _ga=GA1.2.1986366783.1601607319; nfes_isSupportWebP=1; appFloatCnt=8; _gcl_dc=GCL.1601638857.CKzg58XqlewCFQITvAodioIJWw; Session=SmartLinkCode=U155952&SmartLinkKeyWord=&SmartLinkQuary=&SmartLinkHost=&SmartLinkLanguage=zh; Union=OUID=index&AllianceID=4897&SID=155952&SourceID=&createtime=1602506741&Expires=1603111540922; MKT_OrderClick=ASID=4897155952&AID=4897&CSID=155952&OUID=index&CT=1602506740926&CURL=https%3A%2F%2Fwww.ctrip.com%2F%3Fsid%3D155952%26allianceid%3D4897%26ouid%3Dindex&VAL={"pc_vid":"1601607319353.3cid9z"}; MKT_Pagesource=PC; _RF1=218.58.59.72; _bfa=1.1601607319353.3cid9z.1.1602506738089.1602680023977.4.25; _bfi=p1%3D290510%26p2%3D290510%26v1%3D25%26v2%3D24; MKT_CKID_LMT=1602680029515; __zpspc=9.5.1602680029.1602680029.1%232%7Cwww.baidu.com%7C%7C%7C%25E6%2590%25BA%25E7%25A8%258B%7C%23; _gid=GA1.2.1363667416.1602680030; _jzqco=%7C%7C%7C%7C1602680029668%7C1.672451398.1601607321899.1602506755440.1602680029526.1602506755440.1602680029526.undefined.0.0.16.16',

'cookieorigin': 'https://you.ctrip.com',

'origin': 'https://you.ctrip.com',

'pragma': 'no-cache',

'referer': 'https://you.ctrip.com/',

'sec-fetch-dest': 'empty',

'sec-fetch-mode': 'cors',

'sec-fetch-site': 'same-site',

'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/85.0.4183.121 Safari/537.36'

}

dat = {

"arg": {

'channelType': 2,

'collapseType': 0,

'commentTagId': 0,

'pageIndex': 1,

'pageSize': 10,

'poiId': 75648,

'sortType': 3,

'sourceType': 1,

'starType': 0

},

"head": {

'auth': "",

'cid': "09031117213661657011",

'ctok': "",

'cver': "1.0",

'extension': [],

'lang': "01",

'sid': "8888",

'syscode': "09",

'xsid': ""

}

}

r = requests.post(url, data=json.dumps(dat), headers=header)

s = r.json()

print(s)

运行结果:FwA免费资源网

FwA免费资源网

然后右击结果,再点击Show as JSON:FwA免费资源网

FwA免费资源网

最后就会出现目标url的响应信息,就可以进行爬取了!!!FwA免费资源网

总结FwA免费资源网

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/538371.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Android之back键拦截处理

原文链接:http://blog.csdn.net/lyjit/article/details/51597160 ---------------------------------------------------- Back键是手机上的后退键,在Android上有两种方法来获取该按钮的事件。 ** 一:如何捕获Back按键事件 ** 1.直接获取按…

php富强民主,WordPress主题添加“富强、民主、文明、和谐、”等鼠标点击特效

打开“外观-主题-编辑-(最右侧)模板-主题页脚 (footer.php)”加入以下代码/* 鼠标特效 */var a_idx 0;jQuery(document).ready(function($) {$("body").click(function(e) {var a new Array("富强", "民主", "文明", "和谐&quo…

DjangoAdmin站点调整列表页展示

调整列表页展示 1 页大小 每页中显示多少条数据,默认为每页显示100条数据,属性如下: list_per_page1001)打开booktest/admin.py文件,修改AreaAdmin类如下: class BookInfoAdmin(admin.ModelAdmin):list_per…

大华热成像netsdkdemo_千年博物,智慧展馆丨大华股份全力守护“华夏珍宝库”...

陕西历史博物馆作为我国第一座大型现代化国家级博物馆,以及首批国家一级博物馆和全国排名前五的国家顶级博物馆,被誉为“古都明珠 华夏宝库”,是讲述五千年中华文化的大学堂,是我国博物馆事业发展的重要里程碑。随着陕西历史博物馆…

Android中scrollview与webview冲突事件

原文链接:http://www.linuxidc.com/Linux/2014-03/98847.htm -------------------------------------------------------------- 在做更新界面的时候,同时使用了scrollview和webview两个组件。在模拟器中测试的时候没有问题,但是在手机上测试…

最新php常用函数200个,180多个PHP常用函数总结

我们知道任何有效的 php 代码都有可能出现在函数内部,甚至包括其它函数和类定义。本文我们主要和大家分享180多个PHP常用函数总结,希望能帮助大家更高效的学习PHP。数学函数1.abs(): 求绝对值$abs abs(-4.2); //4.211输入: 数字输出: 绝对值数字2.ceil(…

Markdown 使用教程

前言 以前经常在 github 中看到 .md 格式的文件,一直没有注意,也不明白为什么文本文档的后缀不是 .txt ,后来无意中看到了 Markdown,看到了用这个东西写得一些web界面等特别的规整漂亮,顿时不明觉厉。后来自己学习了一下&#xff…

wdm设备驱动程序开发pdf_DWDM是什么 DWDM相关设备功能介绍【图文】

WDM/DWDM技术,什么是WDM/DWDM技术波分复用(WDM)是将两种或多种不同波长的光载波信号(携带各种信息)在发送端经复用器(亦称合波器,Multiplexer)汇合在一起,并耦合到光线路的同一根光纤中进行传输的技术;在接收端,经解复用器(亦称分波器或称去复…

Android 获取CellId以及IMEI 获取基站id

private void setCellIdentity() {if (isMobileConnected(this)) {System.out.println("基站已连接");int cellid0;TelephonyManager tel (TelephonyManager)getSystemService(Context.TELEPHONY_SERVICE);CellLocation cel tel.getCellLocation();//移动联通 GsmC…

团队作业8—团队项目用户验收评审

一、源代码管理的10 个实践问题: 1. 你的团队的源代码控制在哪里?用的是什么系统?如何处理文件的锁定问题? 我们团队项目的源代码在GitHub上托管,用git控制代码版本,我们用的是win10系统。在这个项目上&…

Android中已经添加权限,依然提示缺少权限,此时你需要添加动态权限

原文链接:http://blog.csdn.net/android_hdh/article/details/52583557 ------------------------------- 最近在开发项目时,项目需要获取系统的WRITE_EXTERNAL_STORAGE权限,然后就在清单文件AndroidManifest中添加了该权限,但是…

linux php任务计划,linux系统怎么添加计划任务执行php文件

linux系统怎么添加计划任务执行php文件linux系统怎么添加计划任务执行php文件?PHP不支持多线程,有时候处理问题不是那么爽,小编以php文件为例,讲解linux下的计划任务。linux系统添加计划任务执行php文件方法1.打开linux系统命令行界面。在命令行界面中输入如下命令…

windows server 2008 r2 定时关机_电脑怎么定时关机 秒懂的Win10定时关机命令使用方法...

Win10怎么定时关机?今天芝麻科技网教大家3种Win10定时关机方法,包含用命令定时关机、软件以及杀毒工具定时关机等,也适合XP、Win7和Win8等系统,相信对于一些如夜间下载东西或者大文件,挂机等用户有所帮助。方法一&…

Android-循环访问网站App

网优同事的突然需求。 花了1天开发了出来。 App截图 App操作流程 1、赋值要循环访问网站的地址 2、设置每次循环间隔时间和每次访问间隔时间 3、点击按钮开始访问 下载地址:https://download.csdn.net/download/zengmingen/9983519

与专门团队一起持续交付

BCG Digital Ventures的首席工程师Robin Weston 最近在伦敦持续生命周期大会(Continuous Lifecycle London)上发布了一份经验报告,在该报告中称,外部支持团队能够在难以实施变化的组织和封闭的团队中引入持续交付(CD)实践。该团队…

windows版一键绕id工具_Windows免费版一键绕过IOS13.6激活锁工具XgRiNdA,完美重启!...

支持iOS13.6.1系统,支持iPhone、iPad绕过,支持MEID三网、两网GSM机器,只要一键就可以绕过,可以完美关机重启,并且支持iTunes同步、爱思安装软件。新版本:增加屏幕锁/停用绕过解信号功能、新增12.4~13.2.3绕…

php程序员需要学c语言吗,程序员为什么需要学会C语言

一转眼转行做程序员已经快三年了,刚开始觉得这是个技术活,现在仔细想想每天的工作,好像大多数情况都是在复制粘贴。这不禁让我陷入了恐惧之中,重新思考要突破现有的状况。前两年听说iOS开发使用swift语言开发简单,我就…

Could not find artifact

用Maven install 对父工程安装到本地仓库

uart怎么判断帧错误_UART通讯总线工作原理的理解

奥的斯电梯OCSS/LCBII /TCBC/GECB板与电梯轿厢和电梯井道之间的串行通讯采用了UART通讯,将井道和轿厢的输入、输出和开关部件的信号转换成串行通讯信号传输给电梯操作控制系统,大大节省了现场布线,下面就UART通讯总线工作原理的理解予以描述。…

Laravel核心代码学习--用户认证系统的实现细节

用户认证系统的实现细节 上一节我们介绍了Laravel Auth系统的基础知识,说了他的核心组件都有哪些构成,这一节我们会专注Laravel Auth系统的实现细节,主要关注Auth也就是AuthManager是如何装载认证用的看守器(Guard)和用户提供器(UserProvider…