Python selenium根据class定位页面元素
在日常的网页源码中,我们基于元素的id去定位是最万无一失的,id在单个页面中是不会重复的。但是实际工作中,很多前端开发人员并未给每个元素都编写id属性。通常一段html代码如下:
<div class="sui-tips s-isindex-wrap sui-tips-exceedtipnews" style="display: none; width: auto;"> <div class="sui-tips-arrow" style="left: 15px;"><em>em>div> <div class="sui-tips-body">今天召唤我太多次啦,<br>明天再来调教小度吧!`(*∩_∩*)′div> div>
这个例子中,最外层的div就没有id属性,此时,可以基于class属性来定位元素。常见的基于class定位元素的selenium写法如下:
一、 driver.find_element_by_class_name("classname") 但是好多时候,很多并列的元素如list表单,class都是共用同一个,如:此时driver.find_elements_by_class_name("classname") 就可以派上用场了,该方法可以返回的是一个list列表,那么所有针对list的方法在它上面都同样适用。比如,如果我们知道想要定位的元素在页面中是第n个,则可以这样定位:
二、
driver.find_elements_by_class_name("classname")[n] (注意:是elements,不是element)
需要注明的是,使用上述方法,即使这网页中样的元素只有一个,得到的依旧是一个list对象,只不过长度为1.
当然如果你对css方法比较熟悉,还可以通过css来定位,selenium同样是支持的,css中,"."后面跟class名即可,一个常规的写法如下:
三、
driver.find_element_by_css_selector('.dtb-style-1').click()
如果你的例子足够特殊,这个元素的class属性有多个,上面的方法还可以用多个"."进行并行连接。如:
driver.find_element_by_css_selector('.dtb-style-1.table-dragColumns').click()
还有一种方法同样可以支持多个类的情况,还是css属性方法:
driver.find_element_by_css_selector("[class='dtb-style-1 table-dragColumns']") 用空格分隔即可。
如果你对css属性不熟悉的话,也不打紧,强大的Chrome浏览器能自动帮你生成元素的xpath、css等多种属性。拿百度首页的源码举例,在页面源码文件,定位到元素后,右键,效果如下:
生成的代码复制后,针对此场景可以直接拿来用,但是鉴于现在的网页更新非常频繁,建议还是要在w3c下简单学习下xpath、css selector等重要方法,那样我们可以写出非常灵活的代码,对页面的细微调整会有更强的适应性。
最后,我们还可以通过强大的xpath来定位元素,如果元素有多个class,我们只用选择其中一个放入xpath中即可,否则程序会出错。示例如下:
四、
driver.find_element_by_xpath('//div[@class="u_sp"]/a[1]').click()
这么多方法中,xpath是最最灵活的,因为xpath内置了很多函数,在某些场合中你可能就需要依靠这种灵活性,"灵活"就不可避免的会带来复杂性。尽管如此,小爬还是鼓励你们,在实际工作中,每种定位元素的方法都要学会,很多时候,你会发现你精心写的方法一不小心就不灵了,这个时候掌握多种定位方法,就显得尤为重要了。
有了这些技能,从此在python selenium的世界里,基于class属性定位元素将显得so easy。
欢迎扫码关注我的公众号 获取更多爬虫、数据分析的知识!