selenium 获取href find_element_by_xpath

AI视觉网奇

发布时间 2023.12.06阅读数 778 评论数 0

查询多级目录，中间用*链接：

name_cache = driver.find_element_by_xpath("//div[@class='company-list']/*/div[@class='card']")

首先

Xpath (XML Path Language)，是W3C定义的选择节点的语言

第一种：绝对位置：

此方法比较简单，例子：

xxx.find_element_by_xpath("/html/body/div[x]/form/input")

//x 代表第x个 div标签（索引从1开始而不是0）

当页面元素位置发生改变时，需要修改

第二种：相对位置：

举例： xxx.find_element_by_xpath(“//div[@class=’meneame’]/a”)

//定义class名字为meneame的div下的a标签

第三种：按照标签的属性进行定位：

举例：xxx.find_element_by_xpath(“//div[@class=’meneame’]”)

//定义class名字为meneame的div标签

第四种：选择第几个：

//div/*[2] 选择div下第二个元素

//div/p[position()>=2] 选择div下位置大于等于2的p标签

//div/p[last()] 选择div下最后一个p标签

第五种：并：

//div[@id=’a’ and @name=’b’] 选择id=a 并 class=b的div元素

第六种：父节点：

//div[@id=’a’]/.. 选择目标div的父节点

第七种：同级节点：

preceding-sibling选取当前节点之前的所有同级节点

following-sibling选取当前节点之后的所有同级节点

用法：

//div/following-sibling::p 选择div之后的同级的p节点（div与p同级）

在使用selenium进行抓取url的时候，试图使用find_elements_by_xpath来获取。

因此想当然的直接使用XPATH的语法进行获取属性

事例缩略后xml结构如下

按照XPATH正常的语法，想要获取a标签的url也就是href的属性应该写作

//div[@class=”qg-limit-list”]/a/@href

然而在使用find_elements_by_xpath一直报错，显示只能存放element而不是object。

最后的解决办法就是，这里只取到标签级，想要获取元素在之后再获取如下

xpath_urls = '//div[@class="qg-limit-list"]/a'
urls_pre = browser.find_elements_by_xpath(xpath_urls)
url = urls_pre[0].get_attribute("href")

对，就是加.get_attribute(“href”)，同理想要获得其他属性值，也可以通过他来获取。

这样也可以

page_btns = driver.find_elements_by_xpath(".//div[@class='pc-pager-wrap']/a[@class='pager-item router-link-active']")

if page_btns[-1].text=="下一页":

    new_url= page_btns[-1].get_attribute("href")

Python 爬虫 selenium

转载原出处：

打赏 0

上一篇：视觉SLAM漫谈

下一篇：selenium 安装与 chromedriver安装

selenium 获取href find_element_by_xpath

AI视觉网奇

为你推荐

Python开发手机App——（二）buildozer配置文件

精选linux内核—启动程序

精选Nvidia Nano上从头构建Jetbot镜像安装指南

精选Java的组件化开发方式理解

开篇 - 学习自动控制原理(自控)的另一种视角

扩展卡尔曼滤波EKF

关于作者

AI视觉网奇

17

0

450

2

PCL点云库学习笔记点云的欧式聚类

精选Windows下配置Chrome WebDriver

openCV图像矩阵Mat和二维数组的互相转换

相关推荐

Ubuntu1804安装cuda10和cudnn TensorRT

基于shell脚本和seq传参实现训练多套参数

精选git配合vscode使用上传代码到Gitee(码云)

工业机器人运动学与Matlab正逆解算法学习笔记（用心总结一文全会）（四）——雅可比矩阵

精选信息论 (Information Theory): Introduction and information measures

精选22年电赛B题——具有自动泊车功能的电动车——做题记录以及经验分享

热门泡泡

30积分失眠，聊聊自己搞ROS的心得体会吧

ros学习路线

30积分 TF_REPEATED_DATA ignoring data错误

各位大佬，有什么ROS定位算法推荐吗

5积分想买能用ROS2的开发套件。或者开发板

5积分 ros中启动gazebo时报错

给作者打赏

selenium 获取href find_element_by_xpath

AI视觉网奇

为你推荐

Python开发手机App——（二）buildozer配置文件

精选linux内核—启动程序

精选Nvidia Nano上从头构建Jetbot镜像安装指南

精选Java的组件化开发方式理解

开篇 - 学习自动控制原理(自控)的另一种视角

扩展卡尔曼滤波EKF

评论（0）

关于作者

AI视觉网奇

17

0

450

2

PCL点云库学习笔记 点云的欧式聚类

精选Windows下配置Chrome WebDriver

openCV图像矩阵Mat和二维数组的互相转换

相关推荐

Ubuntu1804安装cuda10和cudnn TensorRT

基于shell脚本和seq传参实现训练多套参数

精选git配合vscode使用 上传代码到Gitee(码云)

工业机器人运动学与Matlab正逆解算法学习笔记（用心总结一文全会）（四）——雅可比矩阵

精选信息论 (Information Theory): Introduction and information measures

精选22年电赛B题——具有自动泊车功能的电动车——做题记录以及经验分享

热门泡泡

30积分 失眠，聊聊自己搞ROS的心得体会吧

ros学习路线

30积分 TF_REPEATED_DATA ignoring data错误

各位大佬，有什么ROS定位算法推荐吗

5积分 想买能用ROS2的开发套件。或者开发板

5积分 ros中启动gazebo时报错

给作者打赏

忘记密码

修改头像

添加你感兴趣的标签

举报类型（必选）

举报详情（选填）

PCL点云库学习笔记点云的欧式聚类

精选git配合vscode使用上传代码到Gitee(码云)

30积分失眠，聊聊自己搞ROS的心得体会吧

5积分想买能用ROS2的开发套件。或者开发板