Selenium的八种定位方式

1. 通过 ID 定位

ID 是最直接和高效的方式来定位元素，因为每个页面中的 ID 应该是唯一的。

from selenium import webdriverdriver = webdriver.Chrome(executable_path='path/to/chromedriver')
driver.get('https://example.com')# 通过 ID 定位
element = driver.find_element(by=By.ID, value='element_id')
print(element.text)

2. 通过 Name 定位

Name 属性也可以用来定位元素，特别是在表单中非常有用。

# 通过 Name 定位
element = driver.find_element(by=By.NAME, value='element_name')
print(element.text)

3. 通过 Class Name 定位

Class 名称通常用于样式和脚本中，也可以用来定位元素。注意，一个页面中可能有多个元素共享同一个 class 名称。

# 通过 Class Name 定位
element = driver.find_element(by=By.CLASS_NAME, value='element_class')
print(element.text)

4. 通过 Tag Name 定位

Tag Name 可以用来定位特定类型的 HTML 元素。

# 通过 Tag Name 定位
element = driver.find_element(by=By.TAG_NAME, value='div')
print(element.text)

5. 通过 Link Text 定位

Link Text 用于定位包含特定文本的链接。

# 通过 Link Text 定位
element = driver.find_element(by=By.LINK_TEXT, value='Link Text')
print(element.text)

6. 通过 Partial Link Text 定位

Partial Link Text 用于定位包含部分特定文本的链接。

# 通过 Partial Link Text 定位
element = driver.find_element(by=By.PARTIAL_LINK_TEXT, value='Part of Link Text')
print(element.text)

7. 通过 XPath 定位

XPath 是一种强大的定位方式，可以用来定位页面上的任何元素，特别是当其他方法不够灵活时。

# 通过 XPath 定位
element = driver.find_element(by=By.XPATH, value='//input[@id="element_id"]')
print(element.text)

8. 通过 CSS Selector 定位

CSS 选择器是一种非常灵活的方式，可以用来定位页面上的任何元素。

# 通过 CSS Selector 定位
element = driver.find_element(by=By.CSS_SELECTOR, value='#element_id')
print(element.text)

9.注意事项

多元素定位：上述方法都返回单个元素。如果你想找到所有匹配的元素，可以使用 find_elements 方法。
等待时间：有时候页面加载较慢，元素可能还没有完全加载出来。在这种情况下，可以使用显式等待或隐式等待来确保元素已经准备好。

1--显式等待示例

from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC# 显式等待直到某个条件满足
element = WebDriverWait(driver, 10).until(EC.presence_of_element_located((By.ID, 'element_id'))
)
print(element.text)

2--隐式等待示例

# 设置隐式等待时间
driver.implicitly_wait(10)  # 单位为秒# 然后继续你的操作
element = driver.find_element(by=By.ID, value='element_id')
print(element.text)

10.定位的简单使用

# 元素定位
import timefrom selenium import webdriver
from selenium.webdriver.common.by import By# 获取浏览器实例
# 获取谷歌浏览器的驱动
webObj = webdriver.Edge()baiDuUrl ="https://www.baidu.com/"
# 打开百度
webObj.get(baiDuUrl)time.sleep(5)# 通过id定位
findElementById = webObj.find_element(By.ID, "kw")print("获取元素的父元素")
print(findElementById.parent)# 通过CSS选择器定位
# 使用class选择器
findELementByCssSelectorClass =  webObj.find_element(By.CSS_SELECTOR,".s-p-top")
# 获取元素的位置
print("获取元素的位置信息")
print(findELementByCssSelectorClass.location)
#  使用id选择器
fintELementByCssSelectId = webObj.find_element(By.CSS_SELECTOR,"#result_logo")
# 获取元素的文本
print(fintELementByCssSelectId.text)# 通过name定位‘
# 使用name属性定位
findElementByName = webObj.find_element(By.NAME,"tn")
# 输入元素的文本
print(findElementByName.text)# 通过class定位
# 使用 class和findElements获取元素
findElementByClasss = webObj.find_elements(By.CLASS_NAME,"rsv_pq")
# 循环遍历输出这些元素
print("-----------------------------------------")
for element in findElementByClasss:print(element.text)print("-----------------------------------------")# 使用Link Text定位
# LinkText这个是精准定位
print("# LinkText这个是模糊定位")
settingInfo =  webObj.find_element(By.LINK_TEXT,"新闻")
print("获取元素的文本信息",settingInfo.text)
# 使用PartialLinkText定位
print("# PartialLinkText这个是模糊定位")
settingInfo2 = webObj.find_element(By.PARTIAL_LINK_TEXT,"贴")
print("获取元素的文本信息",settingInfo2.text)# 通过xpath定位
# 使用class定位
print("使用xpath定位百度的换一换")
findElementByXpath = webObj.find_element(By.XPATH, "//*[@id='hotsearch-refresh-btn']/span")
print("获取元素的文本信息",findElementByXpath.text)time.sleep(10)

效果图

11.xpath的语法

基本语法

1--绝对路径：从根节点开始，使用 /。
```
/html/body/div
```
2--相对路径：从当前节点开始，使用 //。
```
//div
```

节点选择

1--选择特定标签名的节点：
```
//tag_name
```
2--选择具有特定属性的节点：
```
//tag_name[@attribute_name='value']
```

3--选择具有多个属性的节点：

//tag_name[@attribute_name1='value1' and @attribute_name2='value2']

4--选择包含特定文本的节点：
```
//tag_name[text()='text_value']
```

5--选择包含部分文本的节点：

//tag_name[contains(text(), 'partial_text')]

6--选择包含部分属性值的节点：

//tag_name[contains(@attribute_name, 'partial_value')]

节点轴

1--选择子节点：
```
//parent_tag/child_tag
```
2--选择任意后代节点：
```
//ancestor_tag//descendant_tag
```
3--选择父节点：
```
//child_tag/..
```

4--选择兄弟节点：

1----下一个兄弟节点：

//current_tag/following-sibling::next_tag

2----上一个兄弟节点：

//current_tag/preceding-sibling::prev_tag

节点位置

1--选择第一个节点：
```
//tag_name[1]
```
2--选择最后一个节点：
```
//tag_name[last()]
```
3--选择倒数第二个节点：
```
//tag_name[last()-1]
```
4--选择前两个节点：
```
//tag_name[position() <= 2]
```
5--选择奇数位置的节点：
```
//tag_name[position() mod 2 = 1]
```

组合表达式

1--选择多个条件的节点：

//tag_name[@attribute_name='value1' or @attribute_name='value2']

2--选择多个路径的节点：
```
//tag_name1 | //tag_name2
```

示例

假设我们有一个简单的 HTML 页面：

<!DOCTYPE html>
<html>
<head><title>Example Page</title>
</head>
<body><h1>Welcome to Example Page</h1><p id="intro">This is an example paragraph.</p><form><label for="username">Username:</label><input type="text" id="username" name="username"><label for="password">Password:</label><input type="password" id="password" name="password"><button type="submit">Login</button></form>
</body>
</html>

常见 XPath 表达式示例

1--通过 ID 定位：
```
//*[@id='username']
```
2--通过标签名和属性定位：
```
//input[@type='text']
```

3--通过标签名和多个属性定位：

//input[@type='text' and @name='username']

4--通过文本内容定位：
```
//button[text()='Login']
```
5--通过包含部分文本的属性定位：
```
//input[contains(@name, 'user')]
```
6--通过父节点定位子节点：
```
//form/input[@name='username']
```
7--通过索引定位：
```
//form/input[1]
```
8--通过任意层级的后代节点定位：
```
//form//input[@name='password']
```

12.css选择器定位

基本语法

1--选择特定标签名的节点：
```
tag_name
```
2--选择具有特定类名的节点：
```
.class_name
```
3--选择具有特定 ID 的节点：
```
#id_name
```
4--选择具有特定属性的节点：
```
[attribute_name]
```
5--选择具有特定属性值的节点：
```
[attribute_name='value']
```
6--选择包含部分属性值的节点：
```
[attribute_name*='value']
```
7--选择以特定值开头的属性值的节点：
```
[attribute_name^='value']
```
8--选择以特定值结尾的属性值的节点：
```
[attribute_name$='value']
```

组合选择器

1--选择后代节点：
```
ancestor_selector descendant_selector
```
2--选择子节点：
```
parent_selector > child_selector
```

3--选择相邻兄弟节点：

previous_sibling_selector + next_sibling_selector

4--选择一般兄弟节点：

previous_sibling_selector ~ next_sibling_selector

伪类选择器

1--选择第一个子节点：
```
:first-child
```
2--选择最后一个子节点：
```
:last-child
```
3--选择第 n 个子节点：
```
:nth-child(n)
```
4--选择第 n 个类型节点：
```
:nth-of-type(n)
```
5--选择包含特定文本的节点：
```
:contains('text')
```

示例代码

假设我们有一个简单的 HTML 页面：

<!DOCTYPE html>
<html>
<head><title>Example Page</title>
</head>
<body><h1>Welcome to Example Page</h1><p id="intro">This is an example paragraph.</p><form><label for="username">Username:</label><input type="text" id="username" name="username"><label for="password">Password:</label><input type="password" id="password" name="password"><button type="submit">Login</button></form>
</body>
</html>

常见 CSS 选择器示例

1--通过 ID 定位：

from selenium import webdriver
from selenium.webdriver.common.by import Bydriver = webdriver.Chrome(executable_path='path/to/chromedriver')
driver.get('https://example.com')# 通过 ID 定位
element = driver.find_element(by=By.CSS_SELECTOR, value='#username')
print(element.get_attribute('name'))  # 输出: username

2--通过类名定位：

# 通过类名定位
element = driver.find_element(by=By.CSS_SELECTOR, value='.class_name')
print(element.text)

3--通过标签名和属性定位：

# 通过标签名和属性定位
element = driver.find_element(by=By.CSS_SELECTOR, value='input[type="text"]')
print(element.get_attribute('id'))  # 输出: username

4--通过标签名和多个属性定位：

# 通过标签名和多个属性定位
element = driver.find_element(by=By.CSS_SELECTOR, value='input[type="text"][name="username"]')
print(element.get_attribute('id'))  # 输出: username

5--通过包含部分属性值的节点定位：

# 通过包含部分属性值的节点定位
element = driver.find_element(by=By.CSS_SELECTOR, value='input[name*="user"]')
print(element.get_attribute('id'))  # 输出: username

6--通过父节点定位子节点：

# 通过父节点定位子节点
element = driver.find_element(by=By.CSS_SELECTOR, value='form > input[name="username"]')
print(element.get_attribute('id'))  # 输出: username

7--通过索引定位：

# 通过索引定位
element = driver.find_element(by=By.CSS_SELECTOR, value='form input:nth-of-type(1)')
print(element.get_attribute('id'))  # 输出: username

8--通过文本内容定位：

# 通过文本内容定位
element = driver.find_element(by=By.CSS_SELECTOR, value='button:contains("Login")')
print(element.text)  # 输出: Login