Python自动化下载指定公开页面文件

Python自动化下载指定公开页面文件

diannao/2025/7/13 5:01:11/文章来源:https://blog.csdn.net/weixin_61092302/article/details/138576286

示例代码如下，但你拿到本地之需要做两件事才能运行

from selenium import webdriver
from selenium.webdriver.chrome.service import Service
from selenium.webdriver.common.by import By
from selenium.webdriver.common.keys import Keys
import time# 设置Selenium WebDriver
driver_path = r'C:\Users\……\chromedriver-win64\chromedriver-win64\chromedriver.exe'  # 替换为您的ChromeDriver路径
url = 'https://data.sh.gov.cn/view/detail/index.html?type=cp&&id=AB6002012300'  # 替换为实际的下载页面URLservice = Service(executable_path=driver_path)   
# 初始化WebDriver
driver = webdriver.Chrome(service=service)try:# 打开下载页面driver.get(url)# 等待页面加载完成，这里设置了最长等待时间为10秒time.sleep(1)download_button = driver.find_element(By.CSS_SELECTOR, 'span.filebase.xlsx.docType00xlsx')download_button.click()# 等待文件下载完成。这里需要根据实际情况设置等待时间或检查下载状态time.sleep(1)finally:# 关闭浏览器driver.quit()print("Download end!")

1. 需要先下载模拟点击浏览器的软件，并在代码中指定driver_path

Chrome for Testing availabilityhttps://googlechromelabs.github.io/chrome-for-testing/#stable2. 然后安装python库

pip install selenium

然后直接运行就好，xlsx文件就下载到浏览器默认文件夹下了，这是政府公开文件，保存的文件名为

各主要国家贸易经济数据-新.xlsx

3. 如果你有别的需求，要在其他网页下载内容，那么最重要的是找到对应的按钮，这个是整个代码中最难的部分，需要打开浏览器的开发者模式，选中左侧按钮，并找到对应按钮的html代码，如我找到的

<span class="filebase xlsx docType00xlsx">xlsx</span>

这个过程可能需要多尝试才能找到正确的按钮，有必要时多求助AI助手

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/diannao/8319.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

计算机组成原理（超详解！！）第七节中央处理器（上）

计算机组成原理（超详解！！）第七节中央处理器（上）

1.CPU的功能和组成 CPU的功能： 指令控制：程序的顺序控制。操作控制：管理并产生每条指令的操作信号，并把它们送到相应部件，控制这些部件按要求进行动作。时间控制：对各种操作实施…

阅读更多...

MySQL表分区深入指南

MySQL表分区深入指南

MySQL的表分区功能允许将一个表的数据分散存储在多个物理子表中，但在逻辑上仍表现为一个单独的表。这可以帮助提高大型数据库表的查询和维护效率。本文将详细介绍如何在MySQL中实施和管理表分区，包括分区类型、创建分区表的步骤，以及分区表的…

阅读更多...

Day_3

Day_3

1. HttpClient HttpClient是Apache的一个子项目，是高效的、功能丰富的支持HTTP协议的客户端编程工具包作用：发送HTTP请求， 接受相应数据 <dependency><groupId>org.apache.httpcomponents</groupId><artifactId>…

阅读更多...

ES集群搭建、身份认证配置

ES集群搭建、身份认证配置

虚机搭建添加es用户 elasticsearch 默认不允许root用户启动，所以需要创建es用户 useradd elasticsearch passwd elasticsearch解压安装包 #解压es tar -xvzf elasticsearch-7.14.2-linux-x86_64.tar.gz将文件夹赋予es用户权限 #将文件夹赋予es用户权限 sudo c…

阅读更多...

controlnet的preprocessor类型

controlnet的preprocessor类型

GitHub - huggingface/controlnet_auxContribute to huggingface/controlnet_aux development by creating an account on GitHub.https://github.com/huggingface/controlnet_aux/https://huggingface.co/lllyasviel/sd_control_collection

阅读更多...

js中日期Date的使用

js中日期Date的使用

日常搬砖过程中,凡事使用到Date总是一知半解,每次都要查阅资料,今天有时间把这里整理一下,希望今天储备的知识,够以后使用就不用查阅资料了哈,现在开始吧 new Date() 使用它可以创建一个日期实例,并返回代表当前时间的字符串接收参数有5种形式无参数,新创建的 Date 对象代…

阅读更多...

Qt绘制箭头

Qt绘制箭头

Qt绘制箭头接收两个点作为向量的两端，用来确定箭头方向，额外添加参数，确定箭头是否和向量一致然后使用fillPath填充箭头 QPainterPath arrowPath(const QPointF& p1, const QPointF& p2, int direct 0, int endIndex 0, int ar…

阅读更多...

智慧监控高效运维

智慧监控高效运维

随着企业IT建设的不断深入和完善，IT管理的重要性逐渐被重视，打通数据割裂，使业务更加充分融合。亟需一套统一的平台来实现跨品牌跨设备类型的集中监控和管理。 LinkSLA带外监控平台，不仅适用于大规模或超大规模的运维场景&#x…

阅读更多...

量化交易的优势和QMT、Ptrade开通流程

量化交易的优势和QMT、Ptrade开通流程

量化交易没有一个精确的定义，广义上可以认为，凡是借助于数学模型和计算机实现的交易方法都可以称为量化交易。量化交易的基本原理是通过计算机方法对海量的股票市场历史数据进行分析，总结出一些能够带来持续收益的交易因子。根据这些因子编…

阅读更多...

Tomcat添加服务以及设置开机自启

Tomcat添加服务以及设置开机自启

下载地址连接 Index of /dist/tomcat👓 注意点：不要出现中文路径 #环境变量CATALINA_HOME=D:\apache-tomcat-7.0.62 TOMCAT_HOME=D:\apache-tomcat-7.0.62 JAVA_HOME=D:\tool\jdk1.8.0_111 PATH=%CATALINA_HOME%\bin;%CATALINA_HOME%\lib;%CATALINA_HOME%\lib;D:\tool\jdk1.…

阅读更多...

将数据结构和流程可视化——E-R图和DFD图

将数据结构和流程可视化——E-R图和DFD图

通过程序处理数据时，不仅可以将数据保存到文件，还可以将其保存到数据库中。在数据库中数据是以表格形式保存的，但并不是只有一个表格，而是多个表格进行保存，因此数据更易于管理，即使变更数据，也…

阅读更多...

Spring MVC(一)

Spring MVC(一)

1 Spring MVC概述我们在之前学习Servlet的时候，认识了在WEB开发中MVC设计模式，其最为经典的设计就是，通过控制器（Controller）分离模型（Model）和视图（View）。在具体的WEB…

阅读更多...

Redis进阶学习

Redis进阶学习

Redis进阶学习一、Redis事务1.2 Redis监控1.3 Jedis连接1.4 SpringBoot整合1.5 自定义RedisTemple1.6 Redis.conf详解二、 Redis持久化2.1 RDB2.2 AOF进程三、Redis发布订阅3.1 Redis主从复制3.2 集群环境配置3.3、复制原理3.4、宕机后主动变为主机3.5、哨兵模式四、Redis缓…

阅读更多...

【ITK配准】第七期尺度（Metric）-基匹配Metric

【ITK配准】第七期尺度（Metric）-基匹配Metric

很高兴在雪易的CSDN遇见你 VTK技术爱好者 QQ：870202403 公众号：VTK忠粉前言本文分享ITK中的基匹配Metric，即itk::MatchCardinalityImageToImageMetric ，希望对各位小伙伴有所帮助！感谢各位小伙伴的点赞+关注，小易会继续努力分享，一起进步！你的点赞就是我…

阅读更多...

【算法刷题day45】卡码网：70. 爬楼梯（进阶版）；Leetcode：322. 零钱兑换、279. 完全平方数

【算法刷题day45】卡码网：70. 爬楼梯（进阶版）；Leetcode：322. 零钱兑换、279. 完全平方数

文章目录 Leetcode 70. 爬楼梯（进阶版）解题思路代码总结 Leetcode 322. 零钱兑换解题思路代码总结 Leetcode 279. 完全平方数解题思路代码总结草稿图网站 java的Deque Leetcode 70. 爬楼梯（进阶版） 题目：70. 爬楼梯&…

阅读更多...

2024年大数据与艺术设计国际学术会议(ICBDAD 2024)

2024年大数据与艺术设计国际学术会议(ICBDAD 2024)

2024年大数据与艺术设计国际学术会议(ICBDAD 2024) 2024 International Conference on Big Data and Art Design 一、【会议简介】 2024年大数据与艺术设计国际学术会议，听起来好像两个完全不相关的领域，却意外地融合在了一起。在这个会议上&#xff0c…

阅读更多...

力士乐触摸屏维修VCP11.2DWN-003-NN-NN-PW工业液晶屏幕电脑主机深圳捷达工控维修

力士乐触摸屏维修VCP11.2DWN-003-NN-NN-PW工业液晶屏幕电脑主机深圳捷达工控维修

扩展的性能、高系统可用性和多种配置选项借助 lndraControl 系列工业 PC 和显示器，实现高性能和高灵活性。 lndraControl PR 性能分级盒采用最新的 Intel ATOM 和 Core-i 处理器，可与 lndraControl DR 多点触控显示屏集成，连接距离可达 100M…

阅读更多...

el-carousel走马灯页数回到第一页

el-carousel走马灯页数回到第一页

我的走马灯是在一个弹窗里,包裹着一些button,切换到下一页时关闭弹窗再打开弹窗还显示的是上次第二页位置领导很不满意 1. 2.写在你打开弹窗或者关闭弹窗的位置 this.$refs.carousel && (this.$refs.carousel.activeIndex 0); 解释一下: this.$refs.carousel: thi…

阅读更多...

开源数据可视化大屏对接表单数据实践！

开源数据可视化大屏对接表单数据实践！

如果你需要一个表单系统，进行数据收集；可以使用tduck填鸭进行私有化部署，进行表单制作，完成数据收集。在实际业务中，往往需要将收集的数据进行展示或分析；此时就可以使用表单数据推送到TReport中&#xf…

阅读更多...

华为eNSP中型企业局域网网络规划设计（下）

华为eNSP中型企业局域网网络规划设计（下）

→b站传送门，感谢大佬← →华为eNSP中型企业局域网网络规划设计（上）← →拓扑图传送门，可以自己配置着玩← 配置ospf AR3 [AR3]ospf 1 router-id 3.3.3.3 //出口默认路由 [AR3-ospf-1]default-route-advertise always #area…

阅读更多...

最新文章