python扇贝单词书_Python脚本 扇贝单词书爬取

这是一个·用于爬取扇贝单词书的脚本

将在.py文件目录得到一个名为out.txt的输出文件

主要使用了selenium库(webdriver)

使用方式:

更改

13行中指向webdriver驱动器 代码中使用了firefox提供的驱动器

Path = r’C:\Users\pc\Downloads\geckodriver-v0.19.1-win64\geckodriver.exe’

15行中的单词书网页根目录

rootdir=“https://www.shanbay.com/wordbook/6403/”

运行,并且赞美太阳

source code:

# coding=utf-8

from selenium import webdriver

from selenium.webdriver.common.by import By

from selenium.webdriver.common.keys import Keys

from selenium.webdriver.support.ui import Select

from selenium.common.exceptions import NoSuchElementException

from selenium.common.exceptions import NoAlertPresentException

import unittest, time, re

import sys

reload(sys)

sys.setdefaultencoding('utf-8')

Path = r'C:\Users\pc\Downloads\geckodriver-v0.19.1-win64\geckodriver.exe'

f = open("out.txt", "w")

rootdir=“https://www.shanbay.com/wordbook/6403/”

class ShanbeiWord(unittest.TestCase):

def setUp(self):

self.driver = webdriver.Firefox(executable_path=Path)

self.driver.implicitly_wait(30)

self.verificationErrors = []

self.accept_next_alert = True

def test_shanbei_word(self):

s = " "

driver = self.driver

i = 1

while i<12:

driver.get(

driver.find_element_by_xpath("/html/body/div[3]/div/div[1]/div/div[4]/div[7]/div["+str(i)+"]/div[1]/table/tbody/tr/td[1]/a").click()

i=i+1

j=1

while j<10:

#f.write(driver.page_source)

s = str(s)

s=s+str(driver.page_source)

#f.write(str(i)+"+++"+str(j))

driver.find_element_by_link_text(">").click()

j=j+1

print(str(i) + "+++" + str(j))

#f.write(driver.page_source)

s=str(s)

s = s + str(driver.page_source)

s = str(re.findall(r'g>.*', s, flags=0))

s = str(re.findall(r'>.*?<', s, flags=0))

f.write(s)

def is_element_present(self, how, what):

try:

self.driver.find_element(by=how, value=what)

except NoSuchElementException as e:

return False

return True

def is_alert_present(self):

try:

self.driver.switch_to_alert()

except NoAlertPresentException as e:

return False

return True

def close_alert_and_get_its_text(self):

try:

alert = self.driver.switch_to_alert()

alert_text = alert.text

if self.accept_next_alert:

alert.accept()

else:

alert.dismiss()

return alert_text

finally:

self.accept_next_alert = True

def tearDown(self):

self.driver.quit()

self.assertEqual([], self.verificationErrors)

if __name__ == "__main__":

unittest.main()

赞过:

赞 正在加载……

相关

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/244543.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

mybatis insert 忽略 联合唯一索引_MySQL实战中,Insert语句的使用心得总结

提到MySQL的Insert语句&#xff0c;你肯定不陌生&#xff0c;或许已经张口就来&#xff1a;不就是insert into table values(xxx,xxx,xxx)嘛&#xff01;没错&#xff0c;但在实战中&#xff0c;根据不同的需求场景&#xff0c;插入操作在语法、执行方式上的用法多种多样。今天…

html提交多个正则表达式,将多个html文件的正则表达式结果写入.txt outfile

我无法将从多个html文件(文本不是英文)获得的正则表达式结果写入.txt文件。它将它们打印成屏幕上新行的几个字符串&#xff0c;但是当我尝试将它写入outfile时&#xff0c;它只会写入一个随机字符串。我的代码看起来像这样&#xff1a; 你能帮我怎么把所有的字符串写入所有大约…

eureka集群只注册一个_Spring cloud系列教程第十篇- Spring cloud整合Eureka总结篇

Spring cloud系列教程第十篇- Spring cloud整合Eureka总结篇本文主要内容&#xff1a;1&#xff1a;spring cloud整合Eureka总结本文是由凯哥(凯哥Java:kagejava)发布的《spring cloud系列》教程的总第十篇&#xff1a;本文是几个维度中的第一个维度&#xff1a;注册与发现维度…

lepus监控oracle数据库_lepus天兔数据库监控系统搭建记录

一、开场白去年的锅&#xff0c;今年才接。时间都耗在了各种业务测试上&#xff0c;上周刚刚把锅甩了&#xff0c;赶紧把以前没完成的事做完。二、lepus简介简洁、直观、强大的开源数据库监控系统&#xff0c;MySQL/Oracle/MongoDB/Redis一站式性能监控&#xff0c;让数据库监控…

html鼠标滚轴后下一页,鼠标滚动有一页ppt不能马上下翻,而是上下移动,移动到一定位置后才翻到下一页,这是怎么回事?怎么解决?...

一般是这张幻灯片里有图片才会出现这种问题&#xff0c;你的图片格式有问题&#xff0c;点击图片&#xff0c;再点击格式&#xff0c;把图片格式换一下就好了同问&#xff0c;但不是下面两个原因&#xff0c;都试过没用1&#xff0c;ppt的比例太大&#xff0c;缩小比例即可。Ct…

resnet keras 结构_Day146:第二讲 ResNet

出处论文&#xff1a;Deep Residual Learning for Image Recognition作者&#xff1a;Kaiming He, Xiangyu Zhang, Shaoqing Ren, Jian SunImageNet Top5错误率&#xff1a; 3.57%主要思想主要体现在 Residual(残差)&#xff0c;从名字就可以看出&#xff0c;不学绝对值&#x…

influxdb数据过期_Influxdb Cluster下的数据写入

Cluster下的数据写入数据写入的实现主要分析cluster/points_writer.go中的WritePoints函数的实现// WritePoints writes across multiple local and remote data nodes according the consistency level.func (w *PointsWriter) WritePoints(p *WritePointsRequest) error {w.s…

html5内容切换特效,html5+jQuery图片和文字内容同时左右切换特效

html5jQuery图片和文字内容同时左右切换特效&#xff0c;点击图片或者点击左右按钮进行切换&#xff0c;图片转动以及文字内容动画效果切换。查看演示下载资源&#xff1a;22次 下载资源下载积分&#xff1a;20积分js代码 (function(){var bannerIndex 0;var $bannerBgs $(.j…

asp向不同的用户发送信息_【asp.net core 系列】 1 带你了解一下asp.net core

0. 前言 这是一个新的系列&#xff0c;名字是《http://ASP.NET Core 入门到实战》。这个系列主讲http://ASP.NET Core MVC&#xff0c;辅助一些前端的基础知识&#xff08;能用来实现我们需要的即可&#xff0c;并非主讲&#xff09;。同时这个系列也会在后续介绍http://ASP.NE…

python邮件转发_把Gmail邮件转发到gtalk的Python方法

用Python方法把Gmail邮件转发到gtalk有多难&#xff0c;想知道gmail如何转发邮件?gmail自动转发已收到邮件的设置方法。本文就来把这段详细的python学习参考代码贴出来&#xff0c;大家一起参考下吧。gmail转发邮件到gtalk的Python方法源码&#xff1a;#!/usr/bin/env python#…

html 怎么使用http请求数据类型,HTTP请求方式中8种请求方法(简单介绍)

HTTP工作原理HTTP协议定义Web客户端如何从Web服务器请求Web页面&#xff0c;以及服务器如何把Web页面传送给客户端。HTTP协议采用了请求/响应模型。客户端向服务器发送一个请求报文&#xff0c;请求报文包含请求的方法、URL、协议版本、请求头部和请求数据。服务器以一个状态行…

上行30m下行200m是多少宽带_套餐内有多少流量,就加送多少流量!电信流量攻势太凶猛!...

虽然6月6日国内发放了5G商用牌照&#xff0c;5G时代正式开启。但是对于用户来说&#xff0c;要想用上5G服务尚需等待一段时间&#xff0c;因为现在5G手机终端尚未普及、5G资费套餐也未出炉、运营商的5G网络还需要通过建设进一步扩大覆盖范围。在5G真正走近用户的前夕&#xff0…

怎么在终端启用python_在终端启动Python时报错的解决方案

最近&#xff0c;在终端启动Python时&#xff0c;报了一个错误&#xff1a; Failed calling sys.__interactivehook__ Traceback (most recent call last): File "d:\ProgramData\Anaconda3\lib\site.py", line 439, in register_readline readline.read_history_fil…

vue项目html引入css,vue项目引入自定义.css的样式文件

ES6的引入方式&#xff1a;.vue文件中css文件引入import "../assets/common/common.css";//自定义.css的样式路径js文件的引入在main.js中&#xff1a;import API from ./assets/api/api.config.jsVue.prototype.$API API;P.S.&#xff1a;传统上&#xff0c;引入cs…

485通信原理_上位机开发之单片机通信实践

经常会有一些学员会问到上位机与单片机之间通信的问题&#xff0c;而我们经常会讲上位机与PLC之间通信&#xff0c;那么其实对上位机开发来说&#xff0c;不管是和PLC通信&#xff0c;还是和单片机通信&#xff0c;通信原理都是一样的。PLC的本质就是单片机&#xff0c;在单片机…

hive 结构metastone_深入理解hive之事务处理

事务的四个特性1.automicity&#xff1a;原子性2.consistency:一致性3. isolation:独立性4.durability:持久性5.支持事务有几个条件需要满足&#xff1a;1.所有的事务都支持自动提交&#xff1b;2.只支持ORC格式的数据&#xff1b;3.桶表7.配置hive的参数使其支持事务&#xff…

计算机数媒专业优势,27所院校新开设数字媒体艺术专业,“数媒”专业为什么这么火?...

原标题&#xff1a;27所院校新开设数字媒体艺术专业&#xff0c;“数媒”专业为什么这么火&#xff1f;今年2月&#xff0c;教育部公布了2020年度普通高等学校本科专业备案和审批结果。其中&#xff0c;有包括华中农业大学在内的全国27所院校新增备案了“数字媒体艺术”本科专业…

sap 分割评估_SAP那些事-实战篇-73-受托加工的几种方案探讨

大家都知道&#xff0c;SAP中对于委托加工有标准的解决方案&#xff0c;包括标准委托&#xff08;带料委托加工&#xff09;和工序委托&#xff0c;然而&#xff0c;对于受托方&#xff08;即代加工方&#xff09;SAP却没有标准的解决方案&#xff0c;后来想想&#xff0c;也怪…

婚宴座位图html5,图解现代婚宴座位安排

中国人衣、食、住、行素来都有“礼”可循。对于婚宴来说更是讲究&#xff0c;桌子的摆放&#xff0c;座位的安排都需要经过深思熟虑。因为小小的桌椅就关系到婚宴的礼仪以及宾客的身份。下面就让专家为我们进行图解婚宴座位安排和礼仪的指导吧&#xff01;婚礼座位安排&#xf…

c++ 图的连通分量是什么_学习数据结构第五章:图(图的遍历操作)

第五章&#xff1a;图(图的遍历操作)1.图的遍历图的遍历&#xff1a;从图中某一顶点出发&#xff0c;按照某种搜索方法沿着图中的边对图中的所有顶点访问依次且仅访问一次其实树的层次遍历和图的广度优先搜索类似&#xff0c;可以把这个二叉树看成一个图2.广度优先搜索(BFS)广度…