• python selenium 自动化登录页面


    去掉自动化标识,绕过js,绕过ip

    import time
    from selenium import webdriver
    from selenium.webdriver.chrome.options import Options
    
    # 去掉自动化标识,绕过js
    option = Options()
    option.add_experimental_option('excludeSwitches', ['enable-automation'])
    option.add_argument('--disable-blink-features=AutomationControlled')
    # 确定用户文件 ,绕过ip (要把其他已经打开的浏览器关掉)
    option.add_argument(r'--user-data-dir=C:\Users\PC\AppData\Local\Google\Chrome\User Data')
    time.sleep(2)
    driver = webdriver.Chrome(options = option)
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12

    图形验证码获取

    import ddddocr
    from selenium import webdriver
    
    # 定位到图片元素,获取验证码图片链接
    imgelement = driver.find_element('xpath','/html/body/div[1]/div/div[2]/div/div[2]/div/div/div[3]/div[2]/div/div/img')  # 定位验证码图片
    imgelement.screenshot('captcha.jpg')  #保存验证码截图
    # 验证码识别
    ocr = ddddocr.DdddOcr()
    with open('captcha.jpg', 'rb') as f:
        img_bytes = f.read()
    res = ocr.classification(img_bytes)
    print('识别出的验证码为:' + res)
    # 填写验证码
    driver.find_element_by_id(yanzhengmaid).send_keys(res)
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14

    获取用户名的 动态id,并通过id定位元素

    #selenium定位时,发现网页的用户名和密码的id是动态变化的,但有一定的规律
    nameId=driver.find_element_by_xpath("//input[starts-with(@id,169)]").get_attribute("id")  #此处是一个以169开头的动态id
    driver.find_element_by_id(nameId).send_keys('yonghuming')#定位id,并输入值
    
    passwordId=driver.find_element_by_xpath("//input[ends-with(@id,'ps-k')]").get_attribute("id")  #此处是一个以ps-k结尾的动态id
    driver.find_element_by_id(passwordId).send_keys('mima')
    
    testId=driver.find_element_by_xpath("//input[contains(@id,'test')]").get_attribute("id")  #此处是一个包含test的动态id
    driver.find_element_by_id(testId).click()
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
  • 相关阅读:
    20天学习Spark(0)之最简单版Spark入门
    Redis单线程还是多线程?
    HTML、CSS常用的vscode插件 +Css reset 和Normalize.css
    分享程序员面试的7个技巧
    如何手动添加NLTK data
    WEB前端网页设计 网页代码参数(背景、图片)类
    【leetcode】往完全二叉树添加节点
    微信公众号如何运营和管理?
    Navicat将视图结构导出为可运行SQL文件
    样式穿透 >>>、/deep/ 、::v-deep 、:deep(<inner-selector>)应用场景
  • 原文地址:https://blog.csdn.net/hy_13629279398/article/details/132618409