注意:
以上定位,返回的都是一个,而且是第一个,将element改为elements返回的是多个或者一个
from selenium.webdriver import Chrome
#输入一个指令,键盘上的按钮,需要导入包:
from selenium.webdriver.common.keys import Keys
# import time
web = Chrome()
web.get("http://lagou.com")
# 找到某个元素,点击它
el = web.find_element_by_xpath('//*[@id="changeCityBox"]/p[1]/a')
el.click() #点击事件
# # 注意
# el = web.find_element_by_name("???")#找到的是第一个
# el = web.find_elements_by_name("???")#找到的是全部
# #注意:在进行操作时,有可能会加载到一个新的页面,有时他的加载速度会比我们的执行速度慢,这就会导制程序报错
# #解决方法:导入time包,让浏览器缓一会
# time.sleep(1) # 让浏览器缓一缓
# 找到输入框,输入python =>输入回车/点击搜索按钮
web.find_element_by_xpath('//*[@id="search_input"]').send_keys("python",Keys.ENTER)
#查找存放数据的位置,进行数据提取
#找到页面中存放数据的所有的item
item_list = web.find_elements_by_xpath('//*[@id="jobList"]/div[1]/div')
for item in item_list:
job_name = item.find_element_by_xpath('./div[1]/div[1]/div[1]/a').text
print("工作:",job_name)
job_company = item.find_element_by_xpath('./div[1]/div[2]/div[1]/a').text
print('公司:',job_company)
job_salary = item.find_element_by_xpath('./div[1]/div[1]/div[2]/span').text
print("工资:",job_salary)
job_request = item.find_element_by_xpath('//*[@id="jobList"]/div[1]/div[6]/div[1]/div[1]/div[2]').text
print('要求:',job_request)