四六级成绩爬取代码原创

在六级成绩刚发布时,只需要通过学生姓名和身份证号便可以查询到成绩

据此,我们可以利用selenium框架对学生的成绩进行爬取

首先我们要建立一个excel表格,里面放三列(多几列也无所谓),第一列列名取为学生姓名,第二列取为公民身份号码,这两列需要放入已有数据,第三列取为6级成绩,列中不需要放入数据,供后期存入用。

环境搭建: pip install selenium即可

from selenium import webdriver
from selenium.common import TimeoutException
from selenium.webdriver.support.ui import Select
from selenium.webdriver.common.by import By
import pandas as pd
import time
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
data=pd.read_excel('liuji.xlsx')
data_xm=data['学生姓名'].tolist()
data_no=data['公民身份号码'].tolist()# 声明 Chrome 浏览器并设置选项
options = webdriver.ChromeOptions()
options.add_experimental_option('detach', True)# 创建 Chrome WebDriver,并将选项传递给它
browser = webdriver.Chrome(options=options)
url = 'https://cjcx.neea.edu.cn/html1/folder/21083/9970-1.htm'
browser.get(url)select_element = browser.find_element(by='xpath',value="//select[@id='km']")# 使用 Select 类来操作 select 元素
select = Select(select_element)# 选择第二个选项,根据 value 属性选择
select.select_by_value('2')
time.sleep(2)
score_list=[]
for id in range(len(data_xm)):xm = data_xm[id]no = data_no[id]input1=browser.find_element(by='id', value='xm')input1.clear()input1.send_keys(xm)input2=browser.find_element(by='id', value='no')input2.clear()input2.send_keys(no)#browser.save_screenshot(f'image/{xm}.png')button=browser.find_element(by='xpath',value="//input[@id='submitButton']")button.click()# 等待页面跳转try:WebDriverWait(browser, 2).until(EC.url_changes(browser.current_url))# 执行成功跳转后的操作print(f"成功跳转,当前 URL: {browser.current_url}")except TimeoutException:# 超时处理,继续下一轮循环print("页面跳转超时,继续下一轮循环")continuescore_xpath=browser.find_element(by="xpath",value="//*[@id='achievement-tbody']/tr/td[3]")score=score_xpath.textscore_list.append(score)browser.back()data['6级分数'] = score_list  data.to_excel('liuji.xlsx', index=False)

这样就可以非常高效地爬取到同学们地成绩了

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/701889.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

阿里妈妈按关键字或网址搜索商品 API(alimama.item_search)

alimama.item_search API是用于在阿里妈妈广告平台上按关键字或网址搜索商品的。这个API可以帮助广告主在投放广告时,根据关键词找到相关的商品信息,以便更精准地定位广告受众。 要使用这个API,你需要遵循以下步骤: 注册阿里妈妈…

LeetCode 2433.找出前缀异或的原始数组

给你一个长度为 n 的 整数 数组 pref 。找出并返回满足下述条件且长度为 n 的数组 arr : pref[i] arr[0] ^ arr[1] ^ … ^ arr[i]. 注意 ^ 表示 按位异或(bitwise-xor)运算。 可以证明答案是 唯一 的。 示例 1: 输入&#xf…

亿级用户在线状态查询:Redis高效解决方案

在拥有10亿用户的场景中,使用UUID作为用户标识符来统计在线状态是一个很好的选择,因为它可以确保每个用户的唯一性。针对UUID和在线状态统计,结合Redis,您可以采用以下策略: 1. 使用Redis的哈希表(Hashes&…

Python世界之运算符

一、算术运算符 以下假设变量: a10,b20: 运算符 描述 实例 加 - 两个对象相加 a b 输出结果 30 - 减 - 得到负数或是一个数减去另一个数 a - b 输出结果 -10 * 乘 - 两个数相乘或是返回一个被重复若干次的字符串 a * b 输出结…

Seata Server 服务搭建

概述 Seata 分布式事务需要 Seata Seaver 支持,Seata Server在 架构中扮演着 事务管理器的角色。Seata 服务需要往 Nacos 注册中心注册、以及读取配置文件,因此 Seata 启动前需要部署 Nacos 环境。 安装包下载 下载地址: https://download.csdn.net/dow…

【《高性能 MySQL》摘录】第 2 章 MySQL 基准测试

文章目录 2.1 为什么需要基准测试2.2 基准测试的策略2.2.1 测试何种指标 2.3 基准测试方法2.3.1 设计和规划基准测试2.3.2 基准测试应该运行多长时间2.3.3 获取系统性能和状态2.3.4 获得准确的测试结果2.3.5 运行基准测试并分析结果2.3.6 绘图的重要性 2.4 基准测试工具…

SQL多个字段拼接组合成新字段的常用方法

在sql语句中,有时候我们可能需要将两个字段的值放在一起显示,因为他们通常是一起出现的,比如客户名称和客户编号,那我们就要将这两个字段拼接成一个字段。下面是几种常见的方法: 一、CONCAT()函数 SELECT CONCAT(col…

超参数优化

超参数优化 超参数是用于控制学习过程的不同参数值,对机器学习模型的性能有显著影响。例如,随机森林算法中的估计器数量、最大深度和分裂标准等。超参数优化是找到超参数值的正确组合,以便在合理的时间内实现数据最大性能的过程。这个过程在…

MATLAB环境下基于NLEO的算法的脑电EEG信号自发活动瞬态检测

自发脑电信号是一种非平稳性很强的随机信号。在传统的脑电信号处理中,较公认的处理方法大多是建立在假设脑电图是准平稳信号的基础上,即认为它可以分成若干段,每一段的过程基本平稳,但段上叠加着瞬态。瞬态信号是有别于背景节率&a…

Linux环境非root用户配置SSH免密登录,并解决登录仍提示输入密码

Linux环境非root用户配置SSH免密登录,并解决登录仍提示输入密码 ssh免密登录的简单理解 以A和B进行举例:A免密登录B (即在A服务器输入命令:ssh 非root用户名B的IP地址)可以直接免密码直接登录 A生成私钥和公钥&#…

爬虫工作量由小到大的思维转变---<第四十八章 Scrapy 的请求和follow问题>

前言: 有时,在爬取网页的时候,页面可能只能提取到对应的url,但是具体需要提取的信息需要到下一页(url)里面; 这时候,不要在中间件去requests请求去返回response; 用这个方法.... 正文: 在Scrapy框架内,如果你想从一个页面提取URL,然后跳转到这个URL以…

Linux平台下互换ESC和Caps Lock按键

目录 1.调试手段2.设置2.1.查看当前键盘布局2.2.修改配置2.3.重启或logout生效 3.查看按键映射表 参考资料 当使用Linux作为办公平台,设置映射。 如果在windows平台下使用Linux虚拟机,使用windows宿主平台的按键映射。 windows互换ESC和Caps Lock按键 刚…

【Activiti7系列】Activi7简介和基于Spring Boot整合Activiti7(流程设计器)

本文将介绍Activiti7基础概念及基于Spring Boot整合Activiti7(流程设计器)的具体步骤。 作者:后端小肥肠 1. 前言 在企业级应用中,业务流程的管理和执行是至关重要的一环。Activiti7是一个强大的开源工作流引擎,它提供了灵活的流程定义、任务…

【uni-app】生命周期

页面运行过程中,各个阶段的回调函数就是“生命周期钩子函数”。 uni-app 完整支持 Vue 实例的生命周期,同时还新增 应用生命周期 及 页面生命周期。 (1)应用生命周期 函数名说明onLaunch当uni-app 初始化完成时触发&#xff08…

argparse读取参数

用法argparseExample.py简单示例参考 用法 argparse是内置于python中,所以即为直接在命令行中对程序传入参数并让程序运行的便捷工具。具体步骤如下所示 导包,为import argparse创建一个ArugmentParser对象,随后一切都在这个对象里面操作&am…

SpringBoot3+Vue3 基础知识(持续更新中~)

bean 把方法的返回结果注入到ioc中 1: 2: 3: 组合注解封装 实战篇: 解析token: 统一携带token: 驼峰命名与下划线命名转换: NotEmpty!!! mybatis: PageHelper设置后,会将pageNum,和pageSize自己拼接…

安全相关问题记录

一、预防XSS攻击 校验输入时进行格式校验过滤过滤<script>,<iframe>等特殊标签过滤onclick,onerror,onfocus等js事件属性编码转义对需要渲染的内容做编码转义限制限制输入长度cookie设置成 http only

Flink 的历史版本特性介绍(一)

如果你还不了解 Flink 是什么,可以查看我之前的介绍文章:Flink 介绍 如果你想跟着我一起学习 flink,欢迎查看订阅专栏:Flink 专栏 这篇文章列举了 Flink 每次发布的版本中的重要特性,从中可以看出 Flink 是如何一步一步发展到今天的。 Flink 的前身是 Stratosphere 项目…

Git笔记——4

提示&#xff1a;文章写完后&#xff0c;目录可以自动生成&#xff0c;如何生成可参考右边的帮助文档 文章目录 前言 一、操作标签 二、推送标签 三、多人协作一 完成准备工作 协作开发 将内容合并进master 四、多人协作二 协作开发 将内容合并进master 五、解决 git branch -a…

【深度学习笔记】3_11 模型选择、欠拟合和过拟合

注&#xff1a;本文为《动手学深度学习》开源内容&#xff0c;做了部分个人理解标注&#xff0c;仅为个人学习记录&#xff0c;无抄袭搬运意图 3.11 模型选择、欠拟合和过拟合 在前几节基于Fashion-MNIST数据集的实验中&#xff0c;我们评价了机器学习模型在训练数据集和测试数…