python模拟浏览器读取考试题目、答案,导出到EXCEL表中

本实例网页中的题干,类似于“单选题1+1=?(1.0分)”所以用[3:]去除前3个汉字。再用正则去掉最后一对括号及里面的内容。
本实例网页中的选项,类似于
”A、2“
”B、3“
用[2:]去除前2个字符

from DrissionPage import ChromiumPage
import re
from openpyxl import Workbook
from openpyxl import load_workbook
from openpyxl.styles import Font
import os
def remove_last_parentheses(s):pattern = r'\([^()]*\)[^()]*$'result = re.sub(pattern, '', s, count=1)return result
def loadtimu(no):increment=0file_path = "2024.xlsx"red_font = Font(color='FF0000')if os.path.exists(file_path):# 文件存在,打开它wb = load_workbook(file_path)ws = wb.active  # 获取活动工作表else:# 文件不存在,创建一个新的工作簿wb = Workbook()ws = wb.active# 创建页面对象,并启动或接管浏览器page = ChromiumPage()url_template = 'https://**.com/detail/{}.html'while True:  # 无限循环,直到找到匹配的URL或满足其他退出条件url = url_template.format(no)page.get(url)#print(f"正在访问: {url}")page.wait(3) #害怕访问速度过快,模拟人工访问# 检查当前页面的URL是否与我们尝试访问的URL相同if page.url == url:print(f"页面URL匹配: {url}")break  # 退出循环else:no += 1  # 增加no的值以尝试下一个页面increment+= 1print(f"页面URL不匹配,尝试下一个编号: {no}")#url = url_template.format(no)#page.get(url)#print(url)#page.wait(3)q=page.eles('.qusetion-box')print(remove_last_parentheses(q[0].text))row=ws.max_row+1ws.cell(row=row,column=1,value=remove_last_parentheses(q[0].text[3:]))a=page.eles('.option right')column = 2for i in a:print(i.text[2:])ws.cell(row=row, column=column, value=i.text[2:]).font = red_fontcolumn = column + 1c=page.eles('.option ')for i in c:i_text = i.text# 去掉前两个字符if len(i_text) > 2:i_text_without_first_two = i_text[2:]else:# 如果字符串长度小于或等于2,你可能需要处理这种情况i_text_without_first_two = ""  # 或者其他你想要的默认值#print(i_text_without_first_two)ws.cell(row=row, column=column, value=i_text_without_first_two)column=column+1wb.save(file_path)return incrementstart_no = 1******4for i in range(300):  # 假设要处理300个题目current_no = start_no + i  # 计算当前题目编号increment = loadtimu(current_no)start_no += increment

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/7831.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Python中的`next()`函数:深入解析与应用

引言 在Python编程中,迭代是处理数据集合的基础操作。我们熟悉使用for循环和while循环来进行迭代,但你是否知道Python中还提供了一个名为next()的内建函数,它可以用来迭代数据流中的元素?本文将带你深入了解next()函数的工作原理…

OPENAI中Semantic Kernel实现原理以及示例代码用PYTHON来实现

OPENAI中Semantic Kernel实现原理以及示例代码用PYTHON来实现 前言 在人工智能领域,自然语言处理是一个非常重要的研究方向。而在自然语言处理中,语义理解是一个非常关键的问题。在这个领域中,OPENAI的Semantic Kernel是一个非常有名的工具…

如何获得一个Oracle 23ai数据库(Virtual Appliance)

准确的说,是Oracle 23ai Free Developer版,因为企业版目前只在云上(OCI和Azure)和ECC上提供。 方法包括3种,本文介绍第1种: Virtual ApplianceRPM安装Docker 从此处下载虚拟机。 可以看到虚拟机需要4G内…

费马小定理详解

费马小定理 定义: 设 p 为素数,a 为整数,则 a p ≡ a ( m o d p ) a^p \equiv a\ (\mod p) ap≡a (modp) ,若 p ∤ a p \nmid a p∤a ,则 a p − 1 ≡ 1 ( m o d p ) a^{p-1} \equiv 1\ (\mod p) ap−1≡1 (modp)…

力扣437. 路径总和 III

Problem: 437. 路径总和 III 文章目录 题目描述思路复杂度Code 题目描述 思路 1.定义int类型函数rootSum(root, targetSum),用于求取每一个节点等于目标函数的路径数: 1.1.易知rootSum(root, targetSum)求出的数量等于rootSum(root.left, targetSum - va…

代码随想录算法训练营第36期DAY21

DAY21 513找树左下角的值 自己写的,过了(注意到层序遍历中,que队头存的是最左边的节点,再写一个getheight函数控制最大高度就好)。待会看解析,掌握迭代、递归。 优化迭代法:不用找最大深度&am…

2024年4月17日华为春招实习试题【三题】-题目+题解+在线评测,2024.4.17,华为机试

2024年4月17日华为春招实习试题【三题】-题目题解在线评测 🔮题目一描述:扑克牌消消乐输入描述输出描述样例一样例二Limitation解题思路一:模拟,遇到连续3张相同牌号的卡牌,直接删除解题思路二:栈解题思路三…

Scala里的class、object、case class、case object 、trait

Class(类) 定义和作用 Scala 中的 class 是一种蓝图,用于创建对象(实例)。它定义了对象的状态和行为。类可以包含字段(属性)和方法(函数)。类可以有构造器,…

Tarjan算法模板

一、最近公共祖先&#xff08;LCA&#xff09; LCA&#xff1a;Least Common Ancestor P3379 【模板】最近公共祖先&#xff08;LCA&#xff09; #include <bits/stdc.h>using namespace std; typedef long long ll;ll quickin(void) {ll ret 0;bool flag false;cha…

【notepad++】使用

1 notepad 下载路径 https://notepad-plus.en.softonic.com/download 2 设置护眼模式 . 设置——语言格式设置——前景色——黑色 . 背景色——RGB &#xff1a;199 237 204 . 勾选“使用全局背景色”、“使用全局前景色” . 保存并关闭

2009-2022年上市公司华证ESG评级评分数据(含细分项)

2009-2022年上市公司华证ESG评级评分数据&#xff08;含细分项&#xff09; 1、时间&#xff1a;2009-2022年 2、来源&#xff1a;华证ESG 3、指标&#xff1a;证券代码、证券简称、综合评级、年度、综合得分、E评级、E得分、S评级、S得分、G评级、G得分 4、范围&#xff1…

PXE 批量安装部署

目录 一、PEX批量部署优点 二、PXE&#xff1a;预启动执行环境 三、搭建PXE远程服务器 要想全自动安装 接下来请看步骤&#xff1a; 一、PEX批量部署优点 规模化&#xff1a;同时装配多台服务器自动化&#xff1a;安装系统 配置各种服务远程实现&#xff1a;不需要光盘&…

Buuctf-Misc题目练习

打开后是一个gif动图&#xff0c;可以使用stegsolve工具进行逐帧看。 File Format:文件格式 Data Extract:数据提取 Steregram Solve:立体试图 可以左右控制偏移 Frame Browser:帧浏览器 Image Combiner:拼图&#xff0c;图片拼接 所以可以知道我们要选这个Frame Browser …

编程新伙伴:如何利用ChatGPT提升代码编写效率

编程是一项既需要逻辑思维又需要创造性的技术活动。而现在&#xff0c;ChatGPT&#xff0c;一款由OpenAI研发的人工智能&#xff0c;可以帮助你更高效地编写代码。这款AI工具被设计成理解和产生人类的自然语言&#xff0c;现在也得以应用于编程领域。那么&#xff0c;ChatGPT如…

SQL查询语句(二)逻辑运算关键字

上一篇文章中我们提到了条件查询除了一些简单的数学符号之外&#xff0c;还有一些用于条件判断的关键字&#xff0c;如逻辑判断 关键字AND,OR,NOT和范围查找关键字BETWEEN,IN等&#xff1b;下面我们来介绍一些这些关键字的用法以及他们所表达的含义。 目录 逻辑运算关键字 AND…

在K8S中,集群可以做哪些优化?

在Kubernetes&#xff08;简称K8s&#xff09;集群中&#xff0c;可以进行多种优化以提升性能、稳定性和资源利用率。以下是一些常见的优化措施&#xff1a; 控制面组件优化&#xff1a; kube-apiserver 高可用与扩展&#xff1a;通过配置多个API服务器实例并使用负载均衡器分发…

用户管理中心——数据库设计用户注册逻辑设计

用户管理中心——数据库设计&用户注册逻辑设计 规整项目目录1. 数据库自动生成器的使用实现基本的数据库操作&#xff08;操作user表&#xff09; 2. 注册逻辑的设计(1) 写注册逻辑(2) 实现(3) 测试代码 3. 遇到的问题 规整项目目录 utils–存放工具类&#xff0c;比如加密…

信息系统架构基本概念及发展_1.概述和发展

信息系统架构&#xff08;Information Systems Architecture&#xff0c;ISA&#xff09;是一种体系结构&#xff0c;它反映了一个政府、企业或事业单位信息系统的各个组成部分之间的关系&#xff0c;以及信息系统与相关业务&#xff0c;信息系统与相关技术之间的关系。 1.信息…

leetCode33. 搜索旋转排序数组

leetCode33. 搜索旋转排序数组 题目思路 此题的特点是&#xff1a;排好序循环的数组&#xff1a;特点&#xff1a;可以分为两个区间&#xff0c;一半升序&#xff0c;一半降序&#xff0c;或者全部升序 我们可以用二分法&#xff0c;找出升序 到降序的那个临界值&#xff0c;并…

基于Springboot 的 Excel表格的导入导出

首先 &#xff0c;引入相关依赖EasyPOI <dependency><groupId>cn.afterturn</groupId><artifactId>easypoi-spring-boot-starter</artifactId><version>4.4.0</version></dependency> 编写实体类&#xff1a; Data AllArgs…