【办公类-39-03】批量下载微信公众号图片(三)-微信公众号链接的爬虫下载

背景需求:

测试两种公众号图片下载,

1、UIBOT下载速度慢,也需要有UIBOT软件

【办公类-39-01】批量下载微信公众号图片(一)UIBOT图片下载-CSDN博客文章浏览阅读289次。【办公类-39-01】批量下载微信公众号图片(一)UIBOT图片下载https://blog.csdn.net/reasonsummer/article/details/1365229842、360套图无法下载所有图片。

【办公类-39-02】批量下载微信公众号图片(二)-360浏览器套图-CSDN博客文章浏览阅读84次,点赞2次,收藏2次。【办公类-39-01】批量下载微信公众号图片(二)-360浏览器套图https://blog.csdn.net/reasonsummer/article/details/136522853

因此,我只能试试Python爬虫了。

测试过程:

第一次问题:AI不能生成

3eac235cdc24429b957855dc0f9f65de.png

第二次问题:生成爬虫程序,但没有成功获取图片f8a2315686d447c396deb8630fef61f7.png第三次:搜索CSDN

Python爬虫——批量下载微信公众号图片_批量提取微信公众号上的图片-CSDN博客文章浏览阅读1k次,点赞4次,收藏4次。编写Python爬虫程序来实现微信公众号文章图片的下载。_批量提取微信公众号上的图片https://blog.csdn.net/qq_41301570/article/details/131592967

感谢这篇的作者,让我1秒快速下载了图片

1、打开微信,打开微信里的公众号,打开文章,复制右上角的链接

ef1e07dea38a4ec2b5179a063ebfbc57.png

2、代码展示


# 版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。# 原文链接:https://blog.csdn.net/qq_41301570/article/details/131592967import requests
from bs4 import BeautifulSoup
import re
import os
#获取网页信息
def getHTMLText(url):try:r=requests.get(url,timeout=30)r.raise_for_status()r.encoding=r.apparent_encodingreturn r.textexcept:return ""
#解析网页,获取所有图片url
def getimgURL(html):soup = BeautifulSoup(html , "html.parser")adlist=[]for i in soup.find_all("img"):try:ad= re.findall(r'.*src="(.*?)?" .*',str(i))if ad :adlist.append(ad)except:continuereturn adlist
#新建文件夹pic,下载并保存爬取的图片信息
def download(adlist):#注意更改文件目录root=r'C:\Users\jg2yXRZ\OneDrive\桌面\444'+'\\'for i in range(len(adlist)):path=root+str('%02d'%i)+"."+'jpg'if not os.path.exists(root):os.mkdir(root)if not os.path.exists(path):r=requests.get(adlist[i][0])with open(path,'wb') as f:f.write(r.content)f.close()
def main():url = 'https://mp.weixin.qq.com/s/u60kJ1Rxs_qnbLkF-Xv6fw'html=getHTMLText(url)list=getimgURL(html)download(list)
main()

重点说明

993907e8ffd4418baa6315f28ed9d00f.png

debea61410484fb79e50c27a4b7e60fd.png

d0a7603807f84a07b3a8ccd338569fb8.png

“444”文件夹里的图片

872cebedf29a4caa94a0a0891562b2f4.png

2ca01ea52ab44c6abbfd57b4f1c1fe98.png

删除图片后,文件编号就不是连贯的

b8a3987bdc8a4a359875911f05a2e181.png

3、替换文件名,更改序号。

''''
下载公众号图片,所有图片按照文件名改成01 02、03
作者:AI对话大师
时间:2024月3月7日
'''import os
import shutilfolder_path = r'C:\Users\jg2yXRZ\OneDrive\桌面\444'
file_list = os.listdir(folder_path)
image_list = [file for file in file_list if file.lower().endswith(('.jpg'))]for i, image_file in enumerate(image_list):new_file_name = f"{str(i+1).zfill(2)}{os.path.splitext(image_file)[1]}"old_file_path = os.path.join(folder_path, image_file)new_file_path = os.path.join(folder_path, new_file_name)shutil.move(old_file_path, new_file_path)

3976d2ddd8264860a6c7a1700cb33e9f.png

最终效果图 01 、02、03……

77cd874420bc4fb1a1eb90841377ff47.png

原来的图片编码 09 19  20……2ca01ea52ab44c6abbfd57b4f1c1fe98.png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/728762.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

T5模型-基于Transformer架构的通用文本到文本转换模型

T5(Text-to-Text Transfer Transformer)是由Google于2019年提出的一种基于Transformer架构的通用文本到文本转换模型。T5模型通过在大规模数据集上进行预训练,并使用迁移学习的方式在各种自然语言处理任务上取得了出色的性能。它的设计理念是…

认识JAVA数组

以下是一个Java数组的案例,展示了如何创建、初始化和访问数组中的元素: public class ArrayExample {public static void main(String[] args) {// 创建一个整数数组,长度为5int[] numbers new int[5];// 初始化数组元素numbers[0] 1;numb…

Python笔记(三)—— Python循环语句

循环普遍存在于日常生活中,同样,在程序中,循环功能也是至关重要的基础功能。 循环在程序中同判断一样,也是广泛存在的,是非常多功能实现的基础: bilibili循环轮播图 循环和判断一样,同样是程序…

XXE-XML实体注入漏洞

目录 1.xml基础 1.1什么是xml 1.2xml文档结构 1.3 什么是DTD 1.4 什么是实体 1.5 什么是外部实体 2.xxe漏洞 2.1xxe漏洞基本介绍 2.2xxe漏洞的危害 经典漏洞案例分析 3.xxe漏洞挖掘和利用 3.1. 识别潜在的XML入口 3.2. 检查XML处理逻辑 3.3. 构造试探Payload 常…

Redis核心数据结构之字典(一)

字典 概述 字典又称为符号表(symbol table)、关联数组(associative array)或映射(map),是一种保存键值对(key-value pair)的抽象数据结构,在字典中,一个键(key)可以和一个值(value)进行关联(或者说将键映射为值),这些关联的键和…

(delphi11最新学习资料) Object Pascal 学习笔记---第6章第3节(查看内存中的字符串)

6.3.8 查看内存中的字符串 ​ 通过查看字符串的元数据,可以更好地了解字符串内存管理的工作原理,尤其是涉及引用计数时。为此,我在 StringMetaTest 示例中添加了一些代码。 ​ 该程序有两个全局字符串: MyStr1 和 MyStr2。程序将…

OpenText Availability——适用于 Windows 和 Linux 服务器的高可用性和灾难恢复解决方案

OpenText Availability——适用于 Windows 和 Linux 服务器的高可用性和灾难恢复解决方案 连续复制,最大限度地减少数据丢失快速故障转移,最大限度地减少停机时间可忽略的性能影响支持物理、虚拟和基于云的系统平台 停机从多种途径侵扰 IT 企业。 从相…

最佳牛围栏(二分 + 前缀和)

最佳牛围栏 原题链接&#xff1a;https://www.acwing.com/problem/content/104/ 题目 思路 我们发现若是枚举答案的话&#xff0c;那么我们判断是否存在一个平均值大于等于mid&#xff0c;如果最优解是x&#xff0c;那么mid < x的时候&#xff0c;必然可以找到一段&#x…

算法---双指针练习-1(移动零)

移动零 1. 题目解析2. 讲解算法原理数组划分&#xff0c;数组分块&#xff08;核心思想&#xff09;如何做到 3. 编写代码 1. 题目解析 题目地址&#xff1a;点这里 2. 讲解算法原理 数组划分&#xff0c;数组分块&#xff08;核心思想&#xff09; dest一般初始化为-1&#x…

计算机设计大赛 深度学习的视频多目标跟踪实现

文章目录 1 前言2 先上成果3 多目标跟踪的两种方法3.1 方法13.2 方法2 4 Tracking By Detecting的跟踪过程4.1 存在的问题4.2 基于轨迹预测的跟踪方式 5 训练代码6 最后 1 前言 &#x1f525; 优质竞赛项目系列&#xff0c;今天要分享的是 基于深度学习的视频多目标跟踪实现 …

16、电源管理入门之驱动Runtime PM管理

目录 1. 框架介绍 1.1 为什么需要Runtime PM Framework? 1.2 系统框架图 2. Drivers 3. Runtime PM core 4. power domain framework 5. runtime pm的sysfs 6参考: Runtime PM管理也就是设备驱动里面的电源管理,即设备驱动结构体里面的struct dev_pm_ops,只控制设…

bun实现HTTP服务器

Bun 提供了原生 Bun.serve API。它实现了 fetch 以及Node.js的 http 和 https 模块。 这些模块已被重新实现&#xff0c;以使用 Bun 的快速内部 HTTP 基础设施。随意直接使用这些模块;像 Express 这样依赖于这些模块的框架应该开箱即用。有关详细的兼容性信息&#xff0c;请参阅…

vue知识点杂记

目录 Computed 和 Watch 的区别slotfilter过滤器cookies和sessionLocalStorage和SessionStoragekeep-alivenextTick新增对象属性 Computed 和 Watch 的区别 缓存&#xff1a;computed有缓存&#xff0c;所以只有在数据和之前不一样的时候才会执行&#xff1b; watch无缓存&…

postgressql的常用sql语句

模式 默认模式是public,可以根据业务需要,创建多个模式管理不同地区的数据(比如,public是整个湖北的数据,wh是武汉的数据,xy是襄阳的数据) --创建新模式 CREATE SCHEMA wh --模式查询 查询wh模式下的dk_info表 select max(id) FROM wh.dk_info 自增序列 --新增自增序…

同事经常让我帮忙点外卖,但总是不给钱怎么办?

在人际交往的纷繁复杂中&#xff0c;我们常常被各种琐碎的事情所困扰&#xff0c;却往往忽略了那些看似微不足道的小习惯。 事实上&#xff0c;正是这些看似不起眼的习惯&#xff0c;往往对人际关系产生着深远的影响。 其中&#xff0c;及时偿还他人帮助和借物归还便是两个极具…

【HarmonyOS】ArkTS-箭头函数

箭头函数 箭头函数是 比普通函数 更简洁 的一种函数写法 () > {}() > {// 函数体 }let 函数名 () > {// 函数体 }let 函数名 () > {// 函数体 } 函数名(实参1, 实参2)let 函数名 (形参1: 类型, 形参2: 类型) > {// 函数体 } 函数名(实参1, 实参2)let 函数名 …

变频器学习

西门子变频器 SINAMICS V20 入门级变频器 SINAMICS G120C

《Trustzone/TEE/安全-实践版》介绍

第一章&#xff1a;课程说明和准备 课程介绍和说明 资料准备 为什么使用qemu_v8环境&#xff1f; 为什么选择香橙派开发板&#xff1f; optee qemu_v8环境展示 香橙派optee环境展示 第二章&#xff1a;Qemu环境搭建 ubuntu20.04的安装(virtualboxubuntu20.04) 搭建optee qem…

利用“定时执行专家”循环执行BAT、VBS、Python脚本——含参数指定功能

目录 一、软件概述 二、VBS脚本执行设置 三、触发器设置 四、功能亮点 五、总结 在自动化办公和日常计算机任务管理中&#xff0c;定时执行脚本是一项非常重要的功能。今天&#xff0c;我将为大家带来一款名为“定时执行专家”的软件的评测&#xff0c;特别是其定时执行VB…

Unity3D学习之XLua实践——背包系统

文章目录 1 前言2 新建工程导入必要资源2.1 AB包设置2.2 C# 脚本2.3 VSCode 的环境搭建 3 面板拼凑3.1 主面板拼凑3.2 背包面板拼凑3.3 格子复合组件拼凑3.4 常用类别名准备3.5 数据准备3.5.1 图集准备3.5.2 json3.5.3 打AB包 4 Lua读取json表及准备玩家数据5 主面板逻辑6 背包…