数据采集Selenium中的弹窗处理

亿牛云代理.png

在爬虫技术中,弹窗处理是一个常见但具有挑战性的问题。Selenium作为一个强大的网页自动化工具,可以帮助我们有效地处理网页中的各种弹窗。本文将概述如何使用Selenium处理弹窗,并提供实现代码,代码中将使用代理IP技术。

概述

弹窗一般分为两类:浏览器自带的警告弹窗(alert、confirm、prompt)和基于HTML的自定义弹窗。处理这些弹窗需要掌握Selenium提供的不同方法。

1. 浏览器警告弹窗

这些弹窗通常由JavaScript触发,主要包括三种类型:

  • Alert:简单的警告框,只有一个确认按钮。
  • Confirm:确认框,有确认和取消按钮。
  • Prompt:提示框,可以输入文本,并有确认和取消按钮。

2. HTML自定义弹窗

这些弹窗是网页中使用HTML和CSS实现的,需要通过定位HTML元素来进行操作。

细节

1. 处理浏览器警告弹窗

使用Selenium处理浏览器警告弹窗的方法非常简单,主要使用switch_to.alert方法来获取弹窗对象。下面是处理三种警告弹窗的示例代码:

from selenium import webdriver
from selenium.webdriver.common.by import By# 设置代理IP 亿牛云爬虫代理加强版
proxy = "username:password@proxy.16yun.cn:8080"
options = webdriver.ChromeOptions()
options.add_argument(f'--proxy-server=http://{proxy}')driver = webdriver.Chrome(options=options)
driver.get('https://example.com')# 触发Alert弹窗
driver.find_element(By.ID, 'alert_button').click()
alert = driver.switch_to.alert
alert.accept()  # 点击确认按钮# 触发Confirm弹窗
driver.find_element(By.ID, 'confirm_button').click()
confirm = driver.switch_to.alert
confirm.dismiss()  # 点击取消按钮# 触发Prompt弹窗
driver.find_element(By.ID, 'prompt_button').click()
prompt = driver.switch_to.alert
prompt.send_keys('输入的文本')  # 输入文本
prompt.accept()  # 点击确认按钮driver.quit()

2. 处理HTML自定义弹窗

处理HTML自定义弹窗需要找到弹窗的HTML元素并进行相应的操作,例如点击按钮或输入文本。以下是一个示例代码:

from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC# 设置代理IP 亿牛云爬虫代理加强版
proxy = "username:password@proxy.16yun.cn:8080"
options = webdriver.ChromeOptions()
options.add_argument(f'--proxy-server=http://{proxy}')driver = webdriver.Chrome(options=options)
driver.get('https://example.com')# 触发自定义HTML弹窗
driver.find_element(By.ID, 'html_popup_button').click()# 等待弹窗出现
popup = WebDriverWait(driver, 10).until(EC.presence_of_element_located((By.ID, 'custom_popup'))
)# 在弹窗中点击确认按钮
popup.find_element(By.ID, 'confirm_button').click()driver.quit()

结论

处理弹窗是使用Selenium进行网页自动化时常见的问题。通过掌握处理浏览器警告弹窗和HTML自定义弹窗的方法,可以有效地进行网页交互。使用代理IP技术可以避免被目标网站封禁,提高爬虫的稳定性和效率。
希望本文能帮助你更好地理解和使用Selenium处理弹窗。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/34907.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

网络编程基础知识拾遗:用大白话解释什么是交换机、路由器、光猫、IP地址和子网掩码、公网和内网IP、端口和域名

二层交换机 在没有二层交换机的环境中,两台电脑或多个电脑之间的通信主要依赖于直连方式或共享介质。假如你和你的舍友都有一台电脑,当你们之间想要进行通信的时候,在没有二层交换机的情况下,可以使用网线(为了方便理…

btrace使用记录

关于作者:CSDN内容合伙人、技术专家, 从零开始做日活千万级APP。 专注于分享各领域原创系列文章 ,擅长java后端、移动开发、商业变现、人工智能等,希望大家多多支持。 未经允许不得转载 目录 一、导读二、使用三、 推荐阅读 一、导…

线性代数基础概念:向量空间

目录 线性代数基础概念:向量空间 1. 向量空间的定义 2. 向量空间的性质 3. 基底和维数 4. 子空间 5. 向量空间的例子 总结 线性代数基础概念:向量空间 向量空间是线性代数中最基本的概念之一,它为我们提供了一个抽象的框架&#xff0c…

MySQL表解锁

查看锁信息 show full processlist 如果一个表被锁定了,会有一个 “Waiting for table metadata lock” 的提示,表明该表正在等待锁定。 解锁表 删除state上有值的事务 kill query 事务id 表解锁完成

迅为iTOP-2K1000开发板龙芯中科国产64位Loognix主板

硬件配置 国产龙芯处理器,双核64位系统,板载2G DDR3内存,流畅运行Busybox、Buildroot、Loognix、QT5.12 系统! 接口全板载4路USB HOST、2路千兆以太网、2路UART、2路CAN总线、Mini PCIE、SATA固态盘接口、4G接口、GPS接口WIF1、蓝牙、Mini H…

获取个人免费版Ubuntu Pro

首先上官网地址:Ubuntu Pro | Ubuntu 点击页面中的"Get Ubuntu Pro now" 将用途选为“Myself”,在此页面中Ubuntu说明了该版本只面向个人开发者,且最终只允许5台设备免费使用;因而部署设备的抉择就不得不慎重考虑了&am…

基于springboot实现机动车号牌管理系统项目【项目源码+论文说明】计算机毕业设计

基于springboot实现机动车号牌管理系统演示 摘要 在如今社会上,关于信息上面的处理,没有任何一个企业或者个人会忽视,如何让信息急速传递,并且归档储存查询,采用之前的纸张记录模式已经不符合当前使用要求了。所以&am…

node+nginx实现对react进行一键打包部署--windows版

文章目录 nodenginx实现对react进行一键打包部署--windows版1.功能展示及项目准备1.1功能展示 1.2 项目准备1.2.1技术点1.2.2安装相关配置(windows) 2.实现2.1 实现思路2.2 实现步骤2.1 项目准备2.1.1 创建env文件2.1.2 创建api/index.js文件2.1.3 添加解决跨域代码 2.2 项目实…

Android Studio中HAXM安装失败的解决方案(HAXM installation failed)

文章目录 错误示例Hyper-VWindows SandboxWindows Hypervisor Platform(Windows 虚拟化监控程序平台) 出现原因解决方法虚拟机平台方案一方案二方案三 错误示例 表明HAXM (Hardware Accelerated Execution Manager)安装失败了。HAXM是一个硬件辅助虚拟化…

FPGA SATA高速存储设计

今天来讲一篇如何在fpga上实现sata ip,然后利用sata ip实现读写sata 盘的目的,如果需要再速度和容量上增加,那么仅仅需要增加sata ip个数就能够实现增加sata盘,如果仅仅实现data的读写整体来说sata ip设计比较简单,下面…

车载系统类 UI 风格品质非凡

车载系统类 UI 风格品质非凡

数据资产与云计算深度融合:借助云计算技术,优化数据存储、高效处理并创新应用,驱动企业数字化转型

目录 一、引言 二、数据资产与云计算深度融合的必要性 1、数据资产的重要性 2、云计算技术的优势 三、云计算技术在数据资产管理中的应用 1、数据存储的优化 2、数据处理的高效性 3、数据应用的创新 四、云计算驱动企业数字化转型的实践案例 案例一:金融行…

【SpringBoot Web框架实战教程(开源)】01 使用 pom 方式创建 SpringBoot 第一个项目

导读 这是一系列关于 SpringBoot Web框架实战 的教程,从项目的创建,到一个完整的 web 框架(包括异常处理、拦截器、context 上下文等);从0开始,到一个可以直接运用在生产环境中的web框架。而且所有源码均开…

MySQL进阶-索引-使用规则-最左前缀法则和范围查询

文章目录 1、最左前缀法则2、启动mysql3、查询tb_user4、查看tb_user的索引5、执行计划 profession 软件工程 and age31 and status 06、执行计划 profession 软件工程 and age317、执行计划 profession 软件工程8、执行计划 age31 and status 09、执行计划 status 010、执行…

方法的其他形式——方法使用时常见的问题

示例: public class MethodDemo02 {public static void main(String[] args) {//目标:掌握按照方法的实际业务需求不同,设计出合理的方法形式来解决问题//需求:打印三行Hello World.printfHelloWorld();System.out.println("…

K210视觉识别模块学习笔记6: 识别苹果_图形化操作函数_

今日开始学习K210视觉识别模块: 图形化操作函数 亚博智能 K210视觉识别模块...... 固件库: canmv_yahboom_v2.1.1.bin 训练网站: 嘉楠开发者社区 今日学习如何在识别到目标的时候添加图形化操作:(获取坐标、框出目标等) 在识别苹果的基础上 学习与添加 这些操…

C# 入门—实现 Hello, World!

目录 一、.net 平台 二、.net 都能干什么? 三、.net 两种交互模式 四、使用 VS Code 开发 C# 程序 五、实现 Hello, World! 一、.net 平台 下载 .NET(Linux、macOS 和 Windows) (microsoft.com) .NET 简介 - .NET | Microsoft Learn C# :一种编程语言,可以开…

未来出行新选择——加油宝APP,让您的每一次加油都充满智慧与便捷!

一、前言 随着科技的飞速发展,智能手机已经成为我们生活中不可或缺的一部分。为了满足广大车主对便捷、高效加油服务的需求,我们倾力打造了全新的加油宝APP。这款APP不仅为您提供一站式的加油服务,还融合了多项创新功能,让您的出…

C语言入门系列:特殊的main函数和exit函数

文章目录 一,main函数二,exit函数1,exit函数2,atexit()函数2.1 atexit函数的简介2.2 atexit注册的函数一定会被调用吗2.2.1 正常退出测试2.2.2 异常退出测试 一,main函数 一个C程序至少包含一个函数,这个函…

机器学习Python代码实战(二)分类算法:k-最近邻

一.k-最近邻算法步骤 1.选择适当的k值。它表示在预测新的数据点时要考虑的邻居数量。 2.计算距离。计算未知点与其他所有点之间的距离。常用的距离计算方法主要有欧氏距离,曼哈顿距离等。 3.选择邻居。在训练集中选择与要预测的数据点距离最近的k个邻居。 4.预测…