Python+Selenium基本语法

枫铃4年前 (2021-07-11)Python264

对Selenium自动化已有了解，最近开始做h5端的自动化，所以总结了下Python+Selenium自动化基本语法

一、启动浏览器

1、普通方式启动

#coding=utf-8
import time
from selenium import webdriver
driver = webdriver.Chrome()  #启动Chrome浏览器
driver = webdriver.Firefox()  #启动Firefox浏览器
driver = webdriver.Ie  #启动IE浏览器
driver.get("http://www.taobao.com")
time.sleep(3)

2、Headless方式启动

Headless Chrome是Chrome浏览器的无界面形态，可以在不打开浏览器的条件下，使用Chrome所有支持的特性

#coding=utf-8
import time
from selenium import webdriver
options=webdriver.ChromeOptions()
options.add_argument('--headless')  #设置无界面选项
options.add_argument('--disable-gpu')
driver=webdriver.Chrome(options=options)
driver.get('http://www.taobao.com')
print(driver.page_source)

3、加载配置启动浏览器

Selenium操作浏览器是不加载配置的，加载配置需要手动配置，但是我的代码老报错，具体如下，求指点

'''
遇到问题没人解答？小编创建了一个Python学习交流QQ群：778463939
寻找有志同道合的小伙伴，互帮互助,群里还有不错的视频学习教程和PDF电子书！
'''
#coding=utf-8
from selenium import webdriver
option=webdriver.ChromeOptions()
option.add_argument('--user-data-dir=')
driver=webdriver.Chrome(options=option)
driver.get('http://www.taobao.com')

二、元素定位

自动化的核心是定位元素，Selenium提供了八种定位元素的方法，常见如下

1、定位单个元素

id定位：driver.find_element_by_id()
name定位：driver.find_element_by_name()
class定位：driver.find_element_by_class_name()
link定位：driver.find_element_by_link_text()
partial link定位：driver.find_element_by_partial_link_text()
tag定位：driver.find_element_by_tag_name()
css定位：driver.find_element_by_css_selector()
xpath定位：driver.find_element_by_xpath()

2、定位一组元素取下标定位

id定位：driver.find_elements_by_id()[]
name定位：driver.find_elements_by_name()[]
class定位：driver.find_elements_by_class_name()[]
link定位：driver.find_elements_by_link_text()[]
partial link定位：driver.find_elements_by_partial_link_text()[]
tag定位：driver.find_elements_by_tag_name()[]
css定位：driver.find_elements_by_css_selector()[]
xpath定位：driver.find_elements_by_xpath()[]

3、class定位

class定位主要是利用元素的css样式表所引用的伪类名称来进行元素查找，实际定位时，会经常发现一个元素的class name是由多个class组成的复合类，以空格隔开

class含空格解决办法有

（1）class属性唯一但有空格，选择空格两边唯一的那一个

（2）空格隔开的class不唯一，用索引定位

（3）通过css方法定位，空格用.代替

4、xpath定位

xpath就是XML path，可以用xpath来定位html文档中的任意元素，xpath定位是对整个文档进行扫描来定位元素，效率比较低

a.xpath有绝对路径和相对路径，绝对路径用/，相对路径用//
b.xpath以/开头表示让解析引擎从文档的根节点开始，以//开头表示让解析引擎从文档的任意符合的元素节点开始解析
c.xpath路径中有/表示寻找父节点的直接子节点，路径中有//表示寻找父节点所有符合的子节点

5、css定位

css定位和xpath定位类似，但是css执行速度比较快

6、xpath和css定位
在这里插入图片描述

三、等待

1、强制等待

强制等待就是不管程序是否加载完成，都需要等待对应的时间

#coding=utf-8
from selenium import webdriver
import time
driver=webdriver.Chrome()
driver.get('http://www.taobao.com')
time.sleep(5)
driver.quit()

2、隐式等待

隐式等待通过添加webdriver的implicitly_wait()方法，隐式等待设置了一个最长等待时间，如果在规定的时间内页面加载完成后，会立马执行下一步，否则会等待时间截止才执行下一步，隐式等待对webdriver整个周期起作用，所以只需要设置一次

'''
遇到问题没人解答？小编创建了一个Python学习交流QQ群：778463939
寻找有志同道合的小伙伴，互帮互助,群里还有不错的视频学习教程和PDF电子书！
'''
#coding=utf-8
from selenium import webdriver
import time
driver=webdriver.Chrome()
driver.get('http://www.taobao.com')
driver.implicitly_wait(10)
driver.quit()

3、显式等待

显式等待使用WebDriverWait，配合该类的until()或者until_not()方法，根据判断条件灵活等待，显式等待是程序每隔几秒检查一下条件是否成立，成立了则执行下一步，不成立则继续等待，直到超过了最长等待时间，再抛出异常

WebDriverWait调用方法：

WebDriverWait(driver,超时时长,调用频率,忽略异常).until(可执行方法，超时时返回的信息)

driver：WebDriver实例
timeout：超时时间

调用频率是调用until或until_not中的方法的间隔时间，默认是0.5秒
忽略的异常，如果在调用until或until_not的过程中抛出这个元组中的异常，则不中断代码，继续等待，如果抛出的是这个元组外的异常，则中断代码，抛出异常

until或者until_not的可执行方法参数一定要是可调用的，即一定要用call()方法，否则会抛出异常，可以用selenium提供的expected_conditions模块中的条件

#coding=utf-8
from selenium import webdriver
from selenium.webdriver.support.wait  import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
from selenium.webdriver.common.by import By
driver=webdriver.Chrome()
driver.get('http://www.taobao.com')
driver.implicitly_wait(10)
WebDriverWait(driver,5).until(EC.title_is(u"淘宝网 - 淘！我喜欢"))
#判断某个元素是否被加到dom树种，该元素不一定可见
WebDriverWait(driver,5).until(EC.presence_of_element_located((By.CSS_SELECTOR,'.btn-login.ml1.tb-bg.weight')))
#判断某个元素是否可见
WebDriverWait(driver,5).until(EC.visibility_of_element_located((By.CSS_SELECTOR,)))
#判断元素是否可见，传定位的element
WebDriverWait(driver,5).until(EC.visibility_of(driver.find_elements_by_css_selector('.btn-login.ml1.tb-bg.weight')),"未找到该元素")
driver.quit()

五、浏览器操作

'''
遇到问题没人解答？小编创建了一个Python学习交流QQ群：778463939
寻找有志同道合的小伙伴，互帮互助,群里还有不错的视频学习教程和PDF电子书！
'''
#coding=utf-8
from selenium import webdriver
import time
import os
driver=webdriver.Chrome()
driver.get('http://www.taobao.com')
driver.maximize_window()  #浏览器放大
time.sleep(5)
driver.get_screenshot_as_file('.\\1.png')  #截图
picture_time=time.strftime("%Y-%m-%d-%H_%M_%S", time.localtime(time.time()))
directory_time=time.strftime("%Y-%m-%d", time.localtime(time.time()))
try:
    File_Path = os.getcwd() + '\\' + directory_time + '\\'
    if not os.path.exists(File_Path):
        os.makedirs(File_Path)
        print("新建目录成功：%s" %File_Path)
    else:
        print("目录已存在")
except BaseException as msg:
    print("新建目录失败：%s" %msg)
driver.save_screenshot('.\\' + directory_time + '\\' + picture_time + '.png')  #截图
driver.quit()

六、键盘操作

调用键盘事件需要引入keys包

引入方法from selenium.webdriver.common.keys import Keys

通过send_keys()调用按键

send_keys(Keys.TAB)

send_keys(Keys.ENTER)

send_keys(Keys.CONTRAL,'a')

七、鼠标事件

需要引入ActionChains类

引入方法from selenium.webdriver.common.action_chains import ActionChains

ActionChains类常用方法：

perform() 执行所有ActionChains中存储的行为

context_click() 右击

double_click() 双击

drag_and_drop() 拖动

move_to_element() 鼠标悬停

枫铃博客

Python+Selenium基本语法

一、启动浏览器

二、元素定位

三、等待

五、浏览器操作

六、键盘操作

七、鼠标事件

相关文章

利用python同步windows和linux文件

爬虫基本原理

Django 函数和方法的区别

Django 知识补漏单例模式

Django基础知识MTV

Python mysql 索引原理与慢查询优化

发表评论

Copyright xongyi.com Some Rights Reserved. Contact me：ripncn#qq.com (#to@) QQ: 2317881738

Powered By Z-BlogPHP. Theme by TOYEAN.

枫铃博客

Python+Selenium基本语法

一、启动浏览器

二、元素定位

三、等待

五、浏览器操作

六、键盘操作

七、鼠标事件

相关文章

利用python同步windows和linux文件

爬虫基本原理

Django 函数和方法的区别

Django 知识补漏单例模式

Django基础知识MTV

Python mysql 索引原理与慢查询优化

发表评论取消回复

Copyright xongyi.com Some Rights Reserved. Contact me：ripncn#qq.com (#to@) QQ: 2317881738

Powered By Z-BlogPHP. Theme by TOYEAN.

发表评论