爬虫学习笔记-xpath的基本使用

 html示例

 

基本使用

#导入包
#pip install lxmlfrom lxml import etree# xpath解析
# 1.本地文件 etree.parse
# 2.服务器响应的数据 etree.HTML()tree = etree.parse('baidu.html')
# 获取所有的ul下的li标签
l1 = tree.xpath('//ul/li')
print(l1)
print(len(l1))# 获取所有带有id的标签内容"/text()"
l2 = tree.xpath('//ul/li[@id]/text()')
print(l2)
print(len(l2))# 获取id=l1的标签内容,id要带引号
l3 = tree.xpath('//ul/li[@id ="l1"]/text()')
print(l3)# 获取id = c1的li标签的class属性值
l4 = tree.xpath('//ul/li[@id="c1"]/@class')
print(l4)# 获取id中带有l的内容
l5 = tree.xpath('//ul/li[contains(@id,"l")]/text()')
print(l5)#获取class中带有d的内容
l6 = tree.xpath('//ul/li[contains(@class,"d")]/text()')
print(l6)# 获取id为l开头的标签内容
l7 = tree.xpath('//ul/li[starts-with(@id,"l")]/text()')
print(l7)# 获取id=c1且class=c1的标签内容
l8 = tree.xpath('//ul/li[@id="c1" and @class="c1"]/text()')
print(l8)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/654867.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

某大厂关于Linux系统相关面试题

一、Linux系统和Shell 1、写一个sed命令,修改/tmp/input.txt文件的内容,要求:(1) 删除所有空行;(2) 在非空行前面加一个"AAA",在行尾加一个"BBB",即将内容为11111的一行改为&#xff1…

CEF框架中的一些宏定义(二):CEF_CURRENTLY_ON

CEF_CURRENTLY_ON 前面有一篇分析进程和线程的文章提到过: CEF线程模型与初始化过程详解 在Browser进程中在CEF框架中,很多代码都需要由这个browser的主线程来执行,宏定义CEF_CURRENTLY_ON就是用于这个判断的。 这个宏定义及其相关的宏定义…

安防监控项目

一、安防监控项目的概述 安防监控项目是指利用先进的技术手段对特定区域、场所或对象进行全天候、全方位的监控和管理,以确保安全和防范各类安全风险。随着科技的不断发展,安防监控项目已经从传统的简单监控摄像头向数字化、智能化方向发展。这些项目广…

代码随想录算法刷题训练营day19

代码随想录算法刷题训练营day19:LeetCode(404)左叶子之和、LeetCode(112)路径总和、LeetCode(113)路径总和 II、LeetCode(105)从前序与中序遍历序列构造二叉树、LeetCode(106)从中序与后序遍历序列构造二叉树 LeetCode(404)左叶子之和 题目 代码 /*** Definitio…

E. Vlad and a Pair of Numbers(位运算)

思路:如果x在这一位是1,说明a,b在这一位一个是1一个是0,我们默认a为1,b为0.. 对于n的一些位为0,那么a,b在这一位肯定相同。我们想,如果a和b的和右移一位与x相同,所以1的位置是相同的…

图算法 - 最短路径算法 (dijkstra) 迪克斯特拉算法

解决问题: 图中某个顶点到某一个顶点的最短路径 适用场景: 查找带权图的最短路径 代码设计: 首先定义一张图(邻接矩阵,二维数组方式实现) 生成一张图 迪克斯特拉算法实现 采用贪婪的方式,每次获取最短的一条路径,作为下次遍历的起点 使用visited 记录被访问过的节点避免…

网络安全04-sql注入靶场第一关

目录 一、环境准备 1.1我们进入第一关也如图: ​编辑 二、正式开始第一关讲述 2.1很明显它让我们在标签上输入一个ID,那我们就输入在链接后面加?id1 ​编辑 2.2链接后面加个单引号()查看返回的内容,127.0.0.1/sqli/less-1/?id1,id1 …

系统架构设计师教程(二十)系统架构设计师论文写作要点

系统架构设计师论文写作要点 20.1 写作注意事项20.1.1做好准备工作20.1.2 论文写作格式20.2 如何解答试题20.2.1 论文解答步骤20.2.2论文解答实例20.3 论文写作方法20.3.1 如何写好摘要20.3.2 如何写好正文20.3.3 摘要和正文的关系20.4 常见问题及解决办法20.1 写作注意事项 撰…

sqli-labs-master less-1 详解

目录 关于MySQL的一些常识 information_schema 常用的函数 sqli-labs-master less-1 分析PHP源码 测试 关于MySQL的一些常识 information_schema information_schema 是 MySQL 数据库中的一个元数据(metadata)数据库,它包含…

使用Excel计算--任务完成总工作日时长

(Owed by: 春夜喜雨 http://blog.csdn.net/chunyexiyu) 引言 计算任务完成时间周期,和计算金钱一样,是一个比较细致严谨的工作。 通常,我们可能以为,完成周期形如: 任务完成周期 任务结束时间 - 任务开始时间 但是…

C++ 数论相关题目 求组合数Ⅱ

给定 n 组询问,每组询问给定两个整数 a,b ,请你输出 Cbamod(1097) 的值。 输入格式 第一行包含整数 n 。 接下来 n 行,每行包含一组 a 和 b 。 输出格式 共 n 行,每行输出一个询问的解。 数据范围 1≤n≤10000 , 1…

PiflowX组件-FileWrite

FileWrite组件 组件说明 往文件系统写入。 计算引擎 flink 组件分组 file 端口 Inport:默认端口 outport:默认端口 组件属性 名称展示名称默认值允许值是否必填描述例子pathpath“”无是文件路径。hdfs://server1:8020/flink/test/text.txtfo…

方法、数组

方法 是语句的集合,在一起执行一个功能 它是解决一类问题的步骤的有序集合 包含于类或对象中 在程序中创建,在其他地方被引用 设计方法的原则:方法的本意是功能块,就是实现某一个功能的语句块的集合。设计时,最好保持…

【ArcGIS微课1000例】0096:dem三维块状表达(层次地形模型)

文章目录 一、DEM表达方式二、层次模型表达三、注意事项一、DEM表达方式 DEM数字高程模型的表达方式通常有以下4种: 1. 规则格网 2. 不规则三角网 3. 等高线 4. 层次地形模型 作为栅格地理数据,DEM 数据具有2.5维的特征,能够以三维表面的形式进行三维空间表达。但受其数…

IndexedDB查询

Indexeddb 创建、增删改查_indexdb 删除表-CSDN博客本地数据库IndexedDB - 学员管理系统之条件筛选&#xff08;四&#xff09;_indexdb条件查询-CSDN博客 <div align"center"><input type"text" id"input_search"> <button id&q…

在Visual Studio 2022中将源文件扩展名改为 .c 后,没有显示 #define _CRT_SECURE_NO_WARNINGS 1?

一、问题 在Visual Studio 2022中将源文件扩展名改为 .c 后&#xff0c;没有显示 #define _CRT_SECURE_NO_WARNINGS 1&#xff1f; 二、解答 对于使用了不安全的C运行时库函数&#xff08;如strcpy、scanf等&#xff09;而触发的安全警告&#xff0c;编译器不会默认包含_CRT_S…

C#颜色拾取器

1&#xff0c;目的&#xff1a; 获取屏幕上任意位置像素的色值。 2&#xff0c;知识点: 热键的注册与注销。 /// <summary>/// 热键注册/// </summary>/// <param name"hWnd">要定义热键的窗口的句柄 </param>/// <param name"id…

系统架构设计师-22年-上午试题

系统架构设计师-22年-上午试题 更多软考资料 https://ruankao.blog.csdn.net/ 1 ~ 10 1 云计算服务体系结构如下图所示&#xff0c;图中①、②、③分别与 SaaS PaaS Iaas相对应&#xff0c;图中①、②、③应为(1) #mermaid-svg-JFP5ovjA5J3LheS6 {font-family:"trebuch…

【python】符号运算

python的符号运算主要依靠sympy(symbol py)库 1.【符号变量】和【符号函数】 有两种方法&#xff1a;sp.symbols或sp.var 1.1.符号变量 import sympy as sp x,y sp.symbols(x,y) # 定义符号变量x,y #-------------- sp.var(x1,x2&#xff0c;positive True,integer Tru…

【大厂AI课学习笔记】1.3 人工智能产业发展(1)

我国人工智能政策&#xff0c;分为5个阶段。从探索期&#xff0c;到后面的4个阶段。 MORE:&#xff08;以下为文心一言4.0的参考内容&#xff0c;和腾讯课程资料的分阶段&#xff0c;略有不同&#xff09; 我国的人工智能政策发展可以大致分为以下几个阶段&#xff0c;每个阶段…