码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • 汇总selenium利用xpath等找网页节点的方法


    一、通过子节点定位父节点,模拟建立一个test.html

    1. <html>
    2. <body>
    3. <div id="A">
    4. <div>定位到这里1
    5. <div>定位到这里2
    6. <div>定位到这里3
    7. <div id="C">子节点div>
    8. div>
    9. div>
    10. div>
    11. div>
    12. body>
    13. html>

    直接上代码

    1. from selenium import webdriver
    2. from selenium.webdriver.support.ui import WebDriverWait
    3. from selenium.webdriver.support import expected_conditions as EC
    4. from selenium.webdriver.common.by import By
    5. driver = webdriver.Chrome()
    6. driver.get('D:\\LC\\PycharmProjects\\xpath_css_dingwei\\test.html')
    7. # .代表当前节点, ..代表父节点
    8. node=driver.find_element(By.XPATH,'//div[@id="C"]/../..')
    9. str=node.text
    10. print(str)#会输出父节点内所有的文本
    11. str_list=str.split('\n')
    12. print(str_list)#如想只输出指定父节点内的文本,先拆分str,然后指定输出,如str_list[0]
    13. # node=WebDriverWait(driver, 10).until(EC.presence_of_element_located((By.XPATH, '//div[@id="C"]/../..')))
    14. # print(node.text)
    15. driver.quit()

    输出结果:

    二、利用节点属性来定位,模拟建立一个login.html

    1. <button onclick="alert('你点击了按钮')" data-var="loginBtn"
    2. data-type="click_navMembership" data-path="sign in"
    3. class="nav-btn p0-sm body-3 u-bold ml2-sm mr2-sm"
    4. data-pre="ILink">
    5. <span>登录span>
    6. button>

    利用节点的指定属性来定位,代码如下

    1. from selenium import webdriver
    2. from selenium.webdriver.common.by import By
    3. from selenium.webdriver.support.ui import WebDriverWait
    4. from selenium.webdriver.support import expected_conditions as EC
    5. import time
    6. driver = webdriver.Chrome()
    7. driver.get('D:\\LC\\PycharmProjects\\xpath_css_dingwei\\login.html')
    8. #利用某个指定属性来定位,如data-var属性
    9. button = WebDriverWait(driver, 5).until(
    10. EC.element_to_be_clickable((By.XPATH, "//button[@data-var='loginBtn']"))
    11. )
    12. button.click()
    13. time.sleep(5)
    14. driver.quit()

    如果一个属性下有多个值,比如class="nav-btn p0-sm body-3 u-bold ml2-sm mr2-sm" 怎么办呢?

    第一种,必须将所有的值都写上才能定位成功。

    1. button = WebDriverWait(driver, 5).until(
    2. EC.element_to_be_clickable((By.XPATH, "//button[@class='nav-btn p0-sm body-3 u-bold ml2-sm mr2-sm']"))
    3. )

    第二种,只需要填一个值就行(其实填包含于就行,如"//button[contains(@class,'nav-btn p0-')]")

    1. button = WebDriverWait(driver, 5).until(
    2. EC.element_to_be_clickable((By.XPATH, "//button[contains(@class,'nav-btn')]"))
    3. )

    第三种,有时可能只需要选择其中几个值,此时需要使用and

    1. button = WebDriverWait(driver, 5).until(
    2. EC.element_to_be_clickable((By.XPATH, "//button[contains(@class,'p0-sm') and contains(@class,'ml2-sm')]"))
    3. )

    三、利用节点文本来定位,仍使用login.html测试代码

    1. #本段代码为示例代码,与login.html无关
    2. #新selenium中,find_element_by_xpath已经无法使用,需要By.XPATH替代
    3. driver.find_element_by_xpath('//a[text()="使用电子邮件登录。")]')
    4. 或者
    5. driver.find_element(By.XPATH, '//a[contains(text(), "下一页")]')

     下面实测:仍使用login.html测试代码如下:

    1. #完美运行,模糊包含定位。注意button内部还有span,不能省略掉span
    2. button = WebDriverWait(driver, 5).until(
    3. EC.element_to_be_clickable((By.XPATH, '//button/span[contains(text(), "登录")]'))
    4. )

    不过以下精确匹配代码却报错,仍未解决,期待博友指教。

    1. button = WebDriverWait(driver, 5).until(
    2. EC.element_to_be_clickable((By.XPATH, '//button/span[text()="登录")]'))
    3. )

    节点定位花样非常多,后续继续写。

    2023/9/15继续更新:针对上述问题,我又设置了个login_2.html,增加了一个标签

    1. <button onclick="alert('你点击了按钮')" data-var="loginBtn"
    2. data-type="click_navMembership" data-path="sign in"
    3. class="nav-btn p0-sm body-3 u-bold ml2-sm mr2-sm"
    4. data-pre="ILink" myname="prev_12345678">
    5. <span>登录</span>
    6. </button>
    7. <a href="http://www.baidu.com">百度搜索</a>

    采用文本精确匹配定位,程序运行正确。

    1. from selenium import webdriver
    2. from selenium.webdriver.common.by import By
    3. import time
    4. driver = webdriver.Chrome()
    5. driver.get('D:\\LC\\PycharmProjects\\xpath_css_dingwei\\login_2.html')
    6. node=driver.find_element(By.XPATH,"//a[text()='百度搜索'] ")
    7. node.click()
    8. time.sleep(5)
    9. driver.quit()

    文本精确匹配定位,测试button,实测也是正确的。

    1. #文本精确匹配定位
    2. node_button=driver.find_element(By.XPATH,"//button/span[text()='登录'] ")
    3. node_button.click()

  • 相关阅读:
    B043-JavascriptDOM&Ajax
    第三方验收测试报告有什么作用?如何获取权威软件测试报告?
    设计模式——访问者模式
    【仿牛客网笔记】Spring Boot实践,开发社区登录模块-账号设置,检查登录
    预测房屋价格(使用SGDRegressor随机梯度下降回归)
    《HelloGitHub》第 93 期
    界面控件DevExpress .NET MAUI v23.2新版亮点 - 拥有全新的彩色主题
    4.9每日一题(多元抽象复合函数求二阶偏导)
    Linux文件系统
    前后端------新增/修改
  • 原文地址:https://blog.csdn.net/kxltsuperr/article/details/132890234
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号