爬虫—抓取表情党热门栏目名称及链接

爬虫—抓取表情党热门栏目名称及链接

表情党网址:https://qq.yh31.com/

目标:抓取表情党主页的热门栏目名称及对应的链接,如下图所示:

Screenshot 2024-01-13 at 16.59.22

按F12(谷歌浏览器),进入开发者工具模式,进行页面分析,在Elements板块下,进入搜索栏(Ctrl+F),在框中输入“//div[@id=“dibu_cc”]//li/a“,可以匹配到所有的热门栏目a标签,如下图:

Screenshot 2024-01-13 at 18.01.26

源码如下:

import requests
from lxml import etreeurl = 'https://qq.yh31.com'
headers= {'user-agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/120.0.0.0 Safari/537.36'
}res = requests.get(url, headers=headers)
tree = etree.HTML(res.content)rm_lst = tree.xpath('//div[@id="dibu_cc"]//li/a')for rm in rm_lst:print('热门栏目名称:', end=' ')print(rm.xpath('./text()'))print('热门栏目链接:', end=' ')print(url + rm.xpath('./@href')[0])

运行结果如下:

Screenshot 2024-01-13 at 18.14.42

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/620593.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【打卡】牛客网:BM84 最长公共前缀

自己写的: 题目要求时间复杂度是o(n*len),说明可以遍历所有的字符。 空间复杂度o(1),说明不能用字符串存储公共前缀,所以用下标来记录。 调试过程: 大概花了20min。 我调试前的做法是,在while循环中&…

网络设备远程运维管理解决方案

在当今高度信息化的时代,网络设备远程运维管理已成为企业运营中的一项核心任务。随着设备数量不断增加,分布日益广泛,传统的现场维护方式已无法满足企业对效率和经济性的需求。如何寻找一种高效、便捷的设备远程运维管理系统,已成…

【WPF.NET开发】文档批注

本文内容 便笺要点数据锚定匹配批注与批注对象 在纸质文档上编写说明或注释毫不稀奇,我们几乎认为这是理所当然的。 这些说明或注释就是“批注”,我们将其添加到文档,用于标注信息或突出显示兴趣项以供日后参考。 虽然在打印文档上编写注释…

c++语言基础21-图形的面积(面向对象)

21 图形的面积 题目描述 考虑一个简单的图形类层次结构,包括基类 Shape 和两个派生类 Rectangle 和 Circle。每个类都有一个用于计算面积的方法。你的任务是编写一个程序,根据输入数据创建一个图形对象,然后计算并输出其面积。 输入描述 输…

大数据StarRocks(七):数据表创建

1. 基本概念 1.1 Row & Column 一张表包括行(Row)和列(Column)。Row 即用户的一行数据。Column 用于描述一行数据中不同的字段。 ⚫ 在默认的数据模型中,Column 只分为排序列和非排序列。存储引擎会按照排序列对…

RK3568笔记八: Display子系统

modetest 是由 libdrm 提供的测试程序,可以查询显示设备的特性,进行基本的显示测试,以及设置显示的模式。 我们可以借助该工具来学习 Linux DRM 应用编程,另外为了深入分析 Rockchip DRM driver,有必要先了解一下这个…

Hive基础知识(十三):Hive的Group by语句与Having语句

1. Group By 语句 GROUP BY 语句通常会和聚合函数一起使用,按照一个或者多个列队结果进行分组,然后对每个组执行聚合操作。 1)案例实操: (1)计算 emp 表每个部门的平均工资 hive (default)> select de…

PHP AES 加密示例

PHP中实现AES加密的一个基本示例涉及到使用openssl_encrypt函数。这个函数允许你使用不同的加密算法,包括AES。下面是一个简单的示例,展示了如何使用AES加密一个字符串。 首先,你需要确定几个关键的参数: 数据(Data&…

redis实现延迟任务(二)

实现思路 我们实现文章地定时发布主要是利用zset地score属性。我们可以在score里存入要发布地时间戳地值,然后在定时刷新任务方法里,通过获取本地时间与score里的时间进行对比,因为本地时间是在不断变大的,如果大于等于的话那么就…

领域驱动设计应用之WebAPI

领域驱动设计应用之WebAPI 此篇文章主要讲述领域驱动设计在WebApi中的应用,以及设计方式,这种设计的原理以及有点。 文章目录 领域驱动设计应用之WebAPI前言一、相对于传统设计模式的有点二、WebAPI对接中的使用案例业务拆分父类设计HttpResponse(返回)…

2024PMP考试新考纲-【过程领域】近期典型真题和很详细解析(5)

今天华研荟继续为您分享【过程Process领域】的新考纲下的真题,进一步帮助大家体会和理解新考纲下PMP的考试特点和如何应用知识来解题,并且举一反三,在两个多月的时间内,一次性、高等级通过2024年PMP考试。 2024年PMP考试新考纲-【…

JavaScript基础04

1 - 数组 1.1 数组的概念 数组可以把一组相关的数据一起存放,并提供方便的访问(获取)方式。 数组是指一组数据的集合,其中的每个数据被称作元素,在数组中可以存放任意类型的元素。数组是一种将一组数据存储在单个变量名下的优雅…

HBase 复制、备份、迁移

行业分享 HBase金融大数据乾坤大挪移 https://www.jianshu.com/p/cb4a645dd66a HBase跨机房迁移技术分享总结 https://www.jianshu.com/p/defc787b2704 dbaplus181期:腾讯金融HBase跨机房迁移实战 https://m.qlchat.com/topic/details?topicId2000003847589595 ht…

神经网络的三个特征,和卷积和最大池化有什么联系

神经网络的三个特征是层次结构、权重共享和非线性激活函数。 层次结构:神经网络由多个层组成,包括输入层、隐藏层和输出层。这种层次结构使得神经网络能够逐层提取数据的特征,并且通过调整每一层的权重来学习数据的表征。 权重共享&#xff…

HarmonyOS的应用类型(FA vs Stage)

HarmonyOS目前提供两种应用模型 FA(Feature Ability)模型: HarmonyOS API 7开始支持的模型,已经不再主推。 Stage模型: HarmonyOS API 9开始新增的模型,是目前主推且会长期演进的模型。在该模型中,由于提供了AbilityStage、WindowStage等类作为应用组件和Window窗口的…

(五)Python中第三方常用库(webbrower、pyautogui、smtplib、xlwt、xlrd、openpyxl等)

文章目录 一、库的安装方法二、pyautogui库(模拟键盘按键、鼠标操作和GUI交互)三、webbrower库(操作浏览器)四、smtplib库(模拟发送邮件)五、xlwt库(操作Excel写入数据)六、xlrd库&a…

C++学习笔记——友元、嵌套类、异常

目录 一、友元 一个使用友元的示例代码 输出结果 二、嵌套类 一个使用嵌套类的示例代码 输出结果 三、异常 一个使用异常处理的示例代码 输出结果 四、结论 五、使用它们的注意事项 上一篇文章链接: C中的继承和模板是非常强大和灵活的特性,它…

【HuggingFace Transformer库学习笔记】基础组件学习:Datasets

基础组件——Datasets datasets基本使用 导入包 from datasets import *加载数据 datasets load_dataset("madao33/new-title-chinese") datasetsDatasetDict({train: Dataset({features: [title, content],num_rows: 5850})validation: Dataset({features: [titl…

【图形学】探秘图形学奥秘:DDA与Bresenham算法的解密与实战

​🌈个人主页:Sarapines Programmer🔥 系列专栏:《图形学 | 图像解码》⏰诗赋清音:云生高巅梦远游, 星光点缀碧海愁。 山川深邃情难晤, 剑气凌云志自修。 ​ 目录 🌌1. 初识模式识别…

AUTOSAR从入门到精通-Autosar 中断机制(六)

目录 知识储备 安全机制的程序流监控 看门狗在autosar 架构中位置 看门狗在autosar中简单流程