Selenium(6)：元素定位_xpath定位

XPATH是什么

　　XPATH是一门在XML文档中查找信息的语言，XPATH可用来在XML文档中对元素和属性进行遍历，主流的浏览器都支持XPATH，因为HTML页面在DOM中表示为XHTML文档。Selenium WebDriver支持使用XPATH表达式来定位元素。

Xpath常用如下6种定位元素的方法：

1、通过绝对路径定位

　　绝对路径的开头是一个斜线（/），从网页的根节点html开始，逐层去查找需要定位的元素。

　　此方法缺点显而易见，当页面元素位置发生改变时，都需要修改，因此，并不推荐使用。

代码如下：

以百度首页的搜索框为例

import os
from selenium import webdriver
from selenium.webdriver.common.by import By

current_path = os.path.dirname(os.path.abspath(__file__))  # 当前路径
driver_path = os.path.join(current_path,'../webdriver/chromedriver.exe')  # driver路径
driver = webdriver.Chrome(executable_path=driver_path)  # Firefox,Ie等

driver.get('https://www.baidu.com/')  # 打开网站

# 绝对路径定位：/ 开头
# 从网页正文的html节点，一直找到元素所在的位置的一种定位方法（从上往下，同层级下标表示）
# 一般不用，难维护，谷歌浏览器自带了复制 绝对路径xpath的功能
driver.find_element(By.XPATH,'/html/body/div[1]/div[1]/div[5]/div/div/form/span[1]/input').send_keys('python')

备注：当同一层次有多个相同的元素时，使用下标区分，下标从1开始；并且注意网页登录状态和非登录状态的html的绝对路径是不一样的

2、通过相对路径定位

　　相对路径的开头是两个斜线（//），表示文件中所有符合模式的元素都会被选出来，即使是处于树中不同的层级也会被选出来。

代码如下：

以百度首页的搜索框为例

import os
from selenium import webdriver
from selenium.webdriver.common.by import By

current_path = os.path.dirname(os.path.abspath(__file__))  # 当前路径
driver_path = os.path.join(current_path,'../webdriver/chromedriver.exe')  # driver路径
driver = webdriver.Chrome(executable_path=driver_path)  # Firefox,Ie等

driver.get('https://www.baidu.com/')  # 打开网站

# 相对路径定位：// 开头
# 在网页正文中，通过独一无二丶局部路径表示元素信息的一种定位方法（从下往上，一层一层试）
driver.find_element(By.XPATH,'//span[1]/input').send_keys('JAVA')  # 最简相对路径
driver.find_element(By.XPATH,'//form/span[1]/input').send_keys('JAVA')  # 最简相对路径

备注：以上都可以定位到百度搜索框，相对路径的长度和开始位置并不受限制，可以采用从后往前逐层定位直到定位到即可的方式去定位。

3、通过元素索引定位

　　遇到同层级相同标签元素时，可以使用索引（下标）表示，索引的初始值为1

代码如下：

以百度首页的hao123链接为例

import os
from selenium import webdriver
from selenium.webdriver.common.by import By

current_path = os.path.dirname(os.path.abspath(__file__))  # 当前路径
driver_path = os.path.join(current_path,'../webdriver/chromedriver.exe')  # driver路径
driver = webdriver.Chrome(executable_path=driver_path)  # Firefox,Ie等

driver.get('https://www.baidu.com/')  # 打开网站
# 元素索引定位
# 遇到同层级相同标签元素时，可以使用索引（下标）表示，索引的初始值为1
driver.find_element(By.XPATH,'//div[3]/a[2]').click()  # 百度首页hao123链接

4、使用元素属性定位

　　元素属性定位要求属性能够定位到唯一一个元素，如果存在多个相同条件的标签，默认定位第一个，具体格式：//标签名[@属性="属性值"]

　　支持使用and和or关键字，多个属性一起定位元素

代码如下：

以百度首页的搜索框为例

import os
from selenium import webdriver
from selenium.webdriver.common.by import By

current_path = os.path.dirname(os.path.abspath(__file__))  # 当前路径
driver_path = os.path.join(current_path,'../webdriver/chromedriver.exe')  # driver路径
driver = webdriver.Chrome(executable_path=driver_path)  # Firefox,Ie等

driver.get('https://www.baidu.com/')  # 打开网站
# 元素属性定位
# 利用元素属性值去定位，但是要保证该属性独一无二，否则可能定位到其他元素
# 语法：//标签名[@属性名="属性值"] 
driver.find_element(By.XPATH,'//input[@id="kw"]').send_keys('python')
# 多属性定位 and,or //标签名[@属性名1="属性值1" and @属性名2="属性值2" ..] 、//标签名[@属性名1="属性值1" or @属性名2="属性值2"]
driver.find_element(By.XPATH,'//input[@id="kw" and @maxlength="255"]').send_keys('python')
driver.find_element(By.XPATH,'//input[@id="kw" or @maxlength="255"]').send_keys('python')
# xpath 支持正则
driver.find_element(By.XPATH,'//*[@*="kw"]').send_keys('python')

备注：Xpath支持通配符号*号，通过属性定位还可以如下写法：driver.find_element(By.XPATH,'//*[@*="kw"]') 5、使用部分属性值匹配（也称为模糊方法定位） 　　属性值如果太长或网页中的元素属性动态变化，可以使用此方法元素属性值字符串开头对比：starts-with(@属性名，"属性值") 元素属性值字符串结尾对比：ends-with(@属性名，"属性值") 元素属性值字符串包含对比：contains(@属性名，"属性值") 备注：ends-with()在selenium中不存在，ends-with()是属于xpath2.0的函数库和语法，而xpath1.0不存在该函数；selenium中的xpath语法使用的是1.0语法，但是appium是使用xpath2.0及以上的语法

代码如下：

以百度首页为例

import os
from selenium import webdriver
from selenium.webdriver.common.by import By

current_path = os.path.dirname(os.path.abspath(__file__))  # 当前路径
driver_path = os.path.join(current_path,'../webdriver/chromedriver.exe')  # driver路径
driver = webdriver.Chrome(executable_path=driver_path)  # Firefox,Ie等

driver.get('https://www.baidu.com/')  # 打开网站
# 部分属性值定位：
# 当元素属性动态变化或元素属性值过长，可以使用的一种定位方法
# 元素属性动态变化：第一次打开页面page_1,第二次打开页面page_2  //a[starts-with(@href,"page_")]
# xpath 三个函数 starts-withs(@属性名,"属性值")字符串开头对比  ends-with()字符串结尾对比  contains()字符串包含
# ends-with()字符串结尾比对 == 是xpath2.0的函数库、语法 而xpath1.0不存在该函数
# selenium中的xpath语法使用的是1.0语法，但是appium是使用xpath2.0及以上的语法
driver.find_element(By.XPATH,'//a[starts-with(@href,"https://haokan.")]').click()
driver.find_element(By.XPATH,'//a[contains(@href,"haokan")]').click()

6、使用元素文本定位

6、使用元素文本定位
　　元素文本在xpath中可以通过text()函数获取，也可以用其来进行元素定位。格式： 文本定位：//a[text()="文本"] 部分文本定位：//a[contains(text(),"文本")]

代码如下：

以百度首页为例

import os
from selenium import webdriver
from selenium.webdriver.common.by import By

current_path = os.path.dirname(os.path.abspath(__file__))  # 当前路径
driver_path = os.path.join(current_path,'../webdriver/chromedriver.exe')  # driver路径
driver = webdriver.Chrome(executable_path=driver_path)  # Firefox,Ie等

driver.get('https://www.baidu.com/')  # 打开网站

# 元素文本定位  text()获取元素的文本值
# by_link_text 与 文本定位区别：文本定位它可用于定位所有包含文本的标签元素，而by_link_text只适合a标签
driver.find_element(By.XPATH,'//a[text()="hao123"]').click()
# 部分文本定位
driver.find_element(By.XPATH,'//a[contains(text(),"hao")]').click()

selenium

Selenium(6)：元素定位_xpath定位

相关

selenium python学习笔记之八窗口截图、验证码处理

（八）自动化测试之selenium学习心得-Xpath选择器

docker selenium 分布式

Python + Selenium 定位非selected型下拉框的方法

selenium 成功绕过淘宝登录反爬机制

selenium

快速掌握Python Selenium Web自动化：二）Selenium操纵浏览器的最基本用例（转载）

Selenium 执行driver = webdriver.Firefox()时报错解决方案

selenium 元素寻找的另一种方法

pycharm使用selenium库

Selenium 元素等待

selenium(12):启用带插件的chrome浏览器

标签