【学习笔记】Selenium 等待方式详解

学习目的:

详细了解Selenium等待的作用和各等待方式的特点。

第一部分:等待的用处

在Selenium脚本执行过程中,对于元素的定位是有一个超时的时间(大致在1-3秒),若超出此时间仍然定位不到元素,就会抛出异常,中止脚本执行。而页面加载是需要时间且时常不可控的,为了保证脚本执行的稳定性,需要手动设置等待时长。

第二部分:等待方式

隐式等待(Implicit Wait)

说明:隐式等待设置了一个全局的等待时间,告诉Selenium在查找页面元素时,如果元素没有立即出现,就等待一段时间再进行查找,若在规定的时间内元素出现了,则执行下一步,否则抛出异常

# 设置隐式等待时间,单位为秒
driver.implicitly_wait(seconds)

注意:

  • 隐式等待的作用域是全局的,在整个脚本的生命周期内只需设置一次,如果再次设置,后一次的设置会覆盖前一次的设置。
  • 隐式等待会让程序一直等待整个页面加载完成,这可能会导致脚本执行时间过长而影响效率。

显式等待 (ExplicitWait)

说明:

  • 显式等待是针对指定元素进行等待的方式,等到代码运行到显式等待这一行时再进行等待。
  • 显式等待是在代码中明确地指定一个特定的条件,直到条件满足后再继续执行后续代码,比如等待元素可见、可点击、可输入等。
  • 在使用显示等待时,通常会结合TimeoutException、WebDriverWait模块和ExpectedCondition模块来使用。WebDriverWait负责等待的设置,ExpectedConditio模块提供了一系列常用的条件,可以根据具体的需求选择合适的条件,而TimeoutException则设置超时后抛出的异常。

语法

# 显示等待语法
WebDriverWait(driver, timeout). TimeoutException(ExpectedConditio)

该语法的具体含义为:

  1. WebDriverWait(driver, timeout) 创建一个WebDriverWait对象,将传递给它的driver参数作为被等待的WebDriver实例,并设置最长等待时间(timeout)。
  2. . TimeoutException(ExpectedConditio)调用一个TimeoutException()方法并传递一个ExpectedConditio的条件。
  3. 该方法将等待直到条件满足或超时时间达到。

WebDriverWait()参数说明:

参数 描述
driver WebDriver实例,用于等待。
timeout 最长等待时间,超时将抛出TimeoutException异常。
poll_frequency 调用until或until_not中的方法之前的休眠秒数,默认为500毫秒。
ignored_exceptions 忽略某些异常并不抛出异常。
message 超时异常描述信息。

TimeoutException()方法及参数说明:

方法名 描述 参数
until() 等待,直到条件为真 - method:一个预期条件,可以是一个内置条件或自定义条件对象。 - message (可选):超时时要显示的错误消息。
until_not() 等待,直到条件不为真 - method:一个预期条件,可以是一个内置条件或自定义条件对象。 - message (可选):超时时要显示的错误消息。

ExpectedConditio常用条件及说明:

条件语法 条件说明
title_is(title) 检查页面的标题是否正好等于期望的标题。
title_contains(substr) 检查页面的标题是否包含一个子串。
presence_of_element_located(locator) 检查是否在页面的DOM中至少有一个元素存在。
visibility_of_element_located(locator) 检查一个元素是否在页面中可见。元素的可见性不仅意味着元素非隐藏,而且元素的宽和高都大于0。
visibility_of(element) 检查元素是否可见。和visibility_of_element_located类似,但是参数是一个已经在DOM中的元素。
presence_of_all_elements_located(locator) 检查是否所有匹配的元素都存在于页面的DOM中。
text_to_be_present_in_element_value(locator, text) 检查元素的值是否包含期望的字串。
text_to_be_present_in_element(locator, text) 检查元素的文本是否包含期望的字串。
frame_to_be_available_and_switch_to_it(locator) 检查是否可以切换到指定的frame。
invisibility_of_element_located(locator) 检查元素是否处于不可见状态。
element_to_be_clickable(locator) 检查元素是否在页面中可见并且可以被点击。
staleness_of(element) 检查一个元素是否已经从DOM中移除。
element_to_be_selected(element) 检查元素是否被选中。
element_located_to_be_selected(locator) 检查一个元素是否可以被选中。
element_selection_state_to_be(element, is_selected) 检查一个元素的选中状态是否符合预期。
element_located_selection_state_to_be(locator, is_selected) 检查一个元素的选中状态是否可以符合预期。
alert_is_present() 检查是否有alert弹出。

显式等待应用例子:

显式等待直到页面标题包含“摸鱼派”。

from selenium import webdriver
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC

# 初始化并打开Edge浏览器
driver = webdriver.Edge()

# 访问鱼排
driver.get('https://fishpi.cn/')

# 显式等待直到页面标题包含“摸鱼派”
T = WebDriverWait(driver, timeout=10).until (EC.title_contains("摸鱼派"))

# 输出等待结果
print(T)

# 关闭浏览器
driver.quit()

强制等待(Explicit Wait)

说明:使用time库下的sleep()方法来让程序“睡一会”,不考虑代码的逻辑,只要运行到sleep,程序就进入到等待的状态,等待时间由参数(秒)决定,等待结束之后,再继续运行后续的代码。

# 导入time模块,用于等待
import time

# 强制等待
time.sleep(seconds)