爬虫实战篇---12306抢票爬虫

(1)、前言

(此代码经过我的实测具有较强的实用型)每逢佳节,大家对于回家抢票这件事是不是特别头疼呢?今天我在网上发现了这个代码,通过一天的学习,与大家分析下,大家可以直接拿来进行12306抢票,也可以进行优化,进行诸如演唱会的抢票,等等。该代码主要使用了模拟浏览器方式而并没有采用分析请求。

(2)、技术路线

selenium + chromedriver

(3)、思路分析

1、模拟浏览器登录抢票界面,手动进行登录

2、登录完成后让浏览器跳转到购票界面

3、手动输入出发地、目的地、 出发日,检查上面三个信息输入完成后,找到查询按钮,进行车次查询

4、查找我们需要的车次,看下是否有余票(显示有或数子),找到车次的预定的按钮,进行点击,如果没有以上两种情况出现,就循环查询

5、一旦检查到有票,执行预定按钮的点击事件,找到乘客信息,执行点击事件,再找到提交订单按钮,执行点击事件

6、点击完提交订单按钮,会弹出确认的对话框,找到确认按钮,执行点击事件,完成抢票

7、之后完成付款操作

(4)、全部代码

  1 #author: "xian"
  2 #date: 2018/6/9
  3 #使用selenium是不保存登录信息的(cookies)
  4 from selenium import webdriver
  5 from selenium.webdriver.support.ui import WebDriverWait
  6 from selenium.webdriver.support import expected_conditions as EC #期望的条件
  7 from selenium.webdriver.common.by import By
  8 
  9 
 10 
 11 class Qiangpiao(object):
 12     #初始化函数
 13     def __init__(self):
 14         self.login_url = 'https://kyfw.12306.cn/otn/login/init'
 15         self.initmy_url = 'https://kyfw.12306.cn/otn/index/initMy12306'
 16         self.search_url = 'https://kyfw.12306.cn/otn/leftTicket/init'
 17         self.confirmPassenger = 'https://kyfw.12306.cn/otn/confirmPassenger/initDc'
 18         self.driver = webdriver.Chrome() #驱动chrome浏览器进行操作
 19 
 20     def wait_input(self):
 21         self.from_station = input('出发地:')
 22         self.to_station = input('目的地:')
 23         #时间格式一定要对应
 24         self.depart_time = input('出发时间:')
 25         #名字一定要存在于常用联系人中间
 26         self.passengers = input('乘客姓名:(如有多个乘客使用英文逗号分割)').split(',')
 27         self.trains = input('车次:(如有多个车次使用英文逗号分割)').split(',') #结果[G234,...]
 28 
 29     #_login只想在类中调用
 30     def _login(self):
 31         self.driver.get(self.login_url) #打开登录界面
 32         #显示等待(解释:你与心上人约会,以对方来或不来为等待条件即事件是否发生为条件)
 33         #隐示等待(解释:你与心上人约会,以等待时间为条件)
 34         WebDriverWait(self.driver,1000).until(EC.url_to_be(self.initmy_url))
 35         print('恭喜您,您已登录成功了!')
 36 
 37 
 38     def _order_ticket(self):
 39         #1、跳转到查余票的界面
 40         self.driver.get(self.search_url)
 41         #2、等待出发地是否输入正确
 42         WebDriverWait(self.driver ,1000).until(EC.text_to_be_present_in_element_value((By.ID,"fromStationText"),self.from_station))
 43         #3、等待目的地是都输入正确
 44         WebDriverWait(self.driver, 1000).until(EC.text_to_be_present_in_element_value((By.ID,"toStationText"),self.to_station))
 45         #4、等待出发日期是否输入正确
 46         WebDriverWait(self.driver, 1000).until(EC.text_to_be_present_in_element_value((By.ID,"train_date"),self.depart_time))
 47         #5、等待查询按钮是否可用
 48         WebDriverWait(self.driver, 1000).until(EC.element_to_be_clickable((By.ID, "query_ticket")))
 49         #6、如果可以点击找到查询按钮执行点击事件
 50         searchBotton = self.driver.find_element_by_id("query_ticket")
 51         searchBotton.click()
 52         #7、点击查询按钮之后等待车票信息页面被加载完成
 53         WebDriverWait(self.driver, 1000).until(EC.presence_of_element_located((By.XPATH,".//tbody[@id = 'queryLeftTable']/tr")))
 54         #8、找到所有没有datatrain属性的tr标签
 55         tr_list = self.driver.find_elements_by_xpath(".//tbody[@id ='queryLeftTable']/tr[not(@datatran)]")
 56         #9、遍历所有满足条件的tr标签
 57         for tr in tr_list:
 58             train_number = tr.find_element_by_class_name('number').text
 59             if train_number in self.trains:
 60                 left_ticket = tr.find_element_by_xpath('.//td[3]').text #找到第四个td标签下的文本
 61                 if left_ticket == '' or left_ticket.isdigit: #判断输入的车次是否在列表中
 62                     orderBotton = tr.find_element_by_class_name('btn72')
 63                     orderBotton.click()
 64 
 65                     #等待是否来到乘客确认页面
 66                     WebDriverWait(self.driver, 1000).until(EC.url_to_be(self.confirmPassenger))
 67                     #等待所有的乘客信息被加载完毕
 68                     WebDriverWait(self.driver, 1000).until(EC.presence_of_element_located((By.XPATH,".//ul[@id = 'normal_passenger_id']/li")))
 69                     #获取所有的乘客信息
 70                     passanger_labels = self.driver.find_elements_by_xpath(".//ul[@id = 'normal_passenger_id']/li/label")
 71                     for passanger_label in passanger_labels: #遍历所有的label标签
 72                         name = passanger_label.text
 73                         if name in self.passengers:#判断名字是否与之前输入的名字重合
 74                             passanger_label.click() #执行点击操作
 75 
 76                             #获取提交订单的按钮
 77                             submitBotton = self.driver.find_element_by_id('submitOrder_id')
 78                             submitBotton.click()
 79                             #显示等待确人订单对话框是否出现
 80                             WebDriverWait(self.driver, 1000).until(EC.presence_of_element_located((By.CLASS_NAME,'dhtmlx_wins_body_outer')))
 81                             #显示等待确认按钮是否加载出现,出现后执行点击操作
 82                             WebDriverWait(self.driver, 1000).until(EC.presence_of_element_located((By.ID,'qr_submit_id')))
 83                             ConBotton = self.driver.find_element_by_id('qr_submit_id')
 84                             ConBotton.click()
 85                             while ConBotton:
 86                                 ConBotton.click()
 87                                 ConBotton = self.driver.find_element_by_id('qr_submit_id')
 88 
 89                             return
 90 
 91 
 92 
 93 
 94 
 95 
 96 
 97 
 98     def run(self):
 99         self.wait_input()
100         self._login()
101         self._order_ticket()
102 
103 if __name__ == '__main__':
104     spider = Qiangpiao()
105     spider.run()

(5)、运行效果图

之后大家只要在30分钟之内完成在线支付即可,方便实用!

(6)、使用说明

请使用前确保已安装好一个python编译器并完成pyhon的配置windows下推荐使用pycharm,并下载chrome和chromedriver驱动,并将chromedriver配置进python包(如果没配置只要指定路径亦可!)

复制代码按命令行提示操作即可完成抢票

转载于:https://www.cnblogs.com/518894-lu/p/9158843.html

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/397726.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

2018美团CodeM编程大赛 Round A Problem 2 下棋 【贪心】

应该一眼看出来是贪心题,然后想最优解是什么。正确的贪心策略是【原棋盘上每个位置的棋子】都往最近的左边【目标棋盘上棋子】移动,如果左边没有棋子了那就闲置最后处理,如果目标棋盘在该位置上也有棋子,那就算距离为0&#xff08…

nginx 二进制包安装mysql_二进制安装mysql5.7

下载地址:https://downloads.mysql.com/archives/community/[rootlocalhost soft]# lsmysql-5.7.17-linux-glibc2.5-x86_64.tar.gz nginx-1.12.2 nginx-1.12.2.tar.gz[rootlocalhost soft]#1.详细描安装的过程1.1关闭防火墙systemctl stop firewalld.service #停止f…

.NET 类型(Types)的那些事

引言 您是.Net工程师?那 .NetFramework中的类型您知道有三大类吗?(除了引用类型和值类型,还有?) 引用类型一定在“堆”上,值类型一定在“栈”上? 那引用类型在内存中的布局细节您又知…

几种去除数组中重复元素的方法、数组去重

工作中遇到的一个问题&#xff0c;就是去除数组中重复的元素&#xff0c;记录一下几种有效的方法&#xff1a; 第一种思路&#xff1a;遍历要删除的数组arr, 把元素分别放入另一个数组tmp中&#xff0c;在判断该元素在arr中不存在才允许放入tmp中。 <!DOCTYPE html> <…

MongoDB学习使用

一、什么是MongoDB&#xff1f; MongoDB是一个高性能&#xff0c;开源&#xff0c;无模式的文档型数据库&#xff0c;是当前NoSql数据库中比较热门的一种。它在许多场景下可用于替代传统的关系型数据库或键/值存储方式&#xff0c; NoSql&#xff0c;全称是 Not Only Sql,指的是…

域账号更改密码之后代理需要重新配置

在使用域账号的时候&#xff0c;如果需要配置账户和密码&#xff0c;那么最好记录下来&#xff0c;否则将来找不到就很尴尬了。 我遇到的问题是&#xff0c;因为在另外一台电脑配置了域账号&#xff0c;用来联网&#xff0c;提供网络给visual studio 1.Firefox 这个代理的账号…

wcf精通1-15

随笔- 197 文章- 0 评论- 3407 十五天精通WCF——第一天 三种Binding让你KO80%的业务 转眼wcf技术已经出现很多年了&#xff0c;也在.net界混的风生水起&#xff0c;同时.net也是一个高度封装的框架&#xff0c;作为在wcf食物链最顶端的我们所能做的任务已经简单的不能再简单…

python如何实现共享报表系统_使用python来实现报表自动化-阿里云开发者社区

xlwt 常用功能xlrd 常用功能xlutils 常用功能xlwt写Excel时公式的应用xlwt写入特定目录(路径设置)xlwt Python语言中&#xff0c;写入Excel文件的扩展工具。可以实现指定表单、指定单元格的写入。支持excel03版到excel2013版。使用时请确保已经安装python环境。百度百科xlrd Py…

去除inline-block元素间间距的N种方法

这篇文章发布于 2012年04月24日&#xff0c;星期二&#xff0c;22:38&#xff0c;归类于 css相关。 阅读 147771 次, 今日 52 次 by zhangxinxu from http://www.zhangxinxu.com 本文地址&#xff1a;http://www.zhangxinxu.com/wordpress/?p2357 一、现象描述 真正意义上的in…

mysql安装包下载密码_MySQL解压包的安装与下载的图文教程

这篇文章主要为大家详细介绍了mysql解压包的安装基础教程&#xff0c;具有一定的参考价值&#xff0c;感兴趣的小伙伴们可以参考一下由于换了新电脑&#xff0c;所以的环境都要到新电脑去配置。突然发现mysql的配置忘了&#xff0c;然后百度又重新来一遍。特地写一篇文章记录一…

多表联合查询

关联数据库字典表的多表联合查询 inner join…on 自动连接 需要用到表的所有信息时&#xff0c;可以用以下两种方法 1) left join…on… 左连接 &#xff08;以左为准&#xff0c;右边没有NULL代替&#xff09; 2) right join…on… 右连接&#xff08;以右为准&#xff…

http 请求头和响应头

客户端发送请求过程带着的数据&#xff1a; 1.请求地址 2.请求方式 3.请求头 request headers 4.请求参数 https://www.juhe.cn/ 130.... 1a2b....pei 服务端响应给客户端的信息&#xff1a; 1.响应内容 2.响应报文/响应头部 response headers a 响应头 b 响应体 3.http状…

python3.6使用mysql_Python之——Python3.6连接MySQL

只安装了Python是不能连接数据库的&#xff0c;还要安装Python连接MySQL的相关类库&#xff0c;Python2.7连接MySQL的类库很多&#xff0c;MySQL官方最新支持的Python为Python3.4.&#xff0c;如下图所示&#xff1a;那么&#xff0c;在Python3.6上如何实现连接MySQL的功能呢&a…

MVVM模式于MVP模式

MVC、MVP、MVVM这些模式是为了解决开发过程中的实际问题而提出来的&#xff0c;目前作为主流的几种架构模式而被广泛使用。 一.MVP模式(Model-View-Presenter):传统的开发是MVP模式(例如jquery) MVP是把MVC中的Controller换成了Presenter&#xff08;呈现&#xff09;&#xff…

BrowserSync开发利器

2019独角兽企业重金招聘Python工程师标准>>> 大大节省开发时间。安装使用简单。使用步骤&#xff1a; 1、nodejs环境 安装 2、在项目中使用npm安装到本项目 3、对要监听的文件执行响应命令 官网更详细&#xff1a;http://www.browsersync.cn/#install 原理&#xf…

algorithm -- 选择排序

选择排序是《导论》第一章课后习题&#xff0c;仿照插入排序&#xff0c;再次运用循环不变式来证明下算法的正确性&#xff0c;C 源码&#xff1a; // 交换函数 void swap( int& a, int& b ) {a a^b;b a^b;a a^b; } void selectSort( int *arr, int count ) {if( a…

ueeditor无法上传图片_百度ue文本编辑器开发中无法上传图片

第一次发文&#xff0c;好紧张呀&#xff0c;不知道会不会没人看。之前用ue遇到了一些坑&#xff0c;没人看就当自己记录了笔记。第一次用&#xff0c;总是会遇到问题&#xff0c;可以先查看下百度ue的演示http://ueditor.baidu.com/website/onlinedemo.html和API http://fex.b…

SQL 语句优化--IN语句优化案例

为什么80%的码农都做不了架构师&#xff1f;>>> 今天客户系统升级&#xff0c;通过DMVs性能分析查了一下&#xff0c;升级后发现一个语句执行时间比较长&#xff0c;执行语句要好几秒钟&#xff0c;调出语句如下&#xff1a; select distinct field003 from ufi2j0…

Activity跳转

本例中MainActivity为&#xff1a;FirstActivity.java FirstActivity如下&#xff1a; package com.wyl.intentmultiactivitytest;import android.app.Activity; import android.content.Intent; import android.os.Bundle; import android.view.View; import android.view.Vie…

Java课程设计---项目数据库设计(含实体类)

1、数据库分析设计 将数据库命名为&#xff1a;db_student 分析系统中各角色之间的关系 2、表设计 &#xff08;1&#xff09;新建表tb_student&#xff08;学生表&#xff09; &#xff08;2&#xff09;新建表tb_admin&#xff08;管理员表&#xff09; &#xff08;3&#x…