Python+Selenium基本语法

枫铃4年前 (2021-07-11)Python264

对Selenium自动化已有了解,最近开始做h5端的自动化,所以总结了下Python+Selenium自动化基本语法

一、启动浏览器

1、普通方式启动

#coding=utf-8
import time
from selenium import webdriver
driver = webdriver.Chrome()  #启动Chrome浏览器
driver = webdriver.Firefox()  #启动Firefox浏览器
driver = webdriver.Ie  #启动IE浏览器
driver.get("http://www.taobao.com")
time.sleep(3)

2、Headless方式启动

Headless Chrome是Chrome浏览器的无界面形态,可以在不打开浏览器的条件下,使用Chrome所有支持的特性

#coding=utf-8
import time
from selenium import webdriver
options=webdriver.ChromeOptions()
options.add_argument('--headless')  #设置无界面选项
options.add_argument('--disable-gpu')
driver=webdriver.Chrome(options=options)
driver.get('http://www.taobao.com')
print(driver.page_source)

3、加载配置启动浏览器

Selenium操作浏览器是不加载配置的,加载配置需要手动配置,但是我的代码老报错,具体如下,求指点

'''
遇到问题没人解答?小编创建了一个Python学习交流QQ群:778463939
寻找有志同道合的小伙伴,互帮互助,群里还有不错的视频学习教程和PDF电子书!
'''
#coding=utf-8
from selenium import webdriver
option=webdriver.ChromeOptions()
option.add_argument('--user-data-dir=')
driver=webdriver.Chrome(options=option)
driver.get('http://www.taobao.com')

二、元素定位

自动化的核心是定位元素,Selenium提供了八种定位元素的方法,常见如下

1、定位单个元素

  • id定位:driver.find_element_by_id()

  • name定位:driver.find_element_by_name()

  • class定位:driver.find_element_by_class_name()

  • link定位:driver.find_element_by_link_text()

  • partial link定位:driver.find_element_by_partial_link_text()

  • tag定位:driver.find_element_by_tag_name()

  • css定位:driver.find_element_by_css_selector()

  • xpath定位:driver.find_element_by_xpath()

2、定位一组元素取下标定位

  • id定位:driver.find_elements_by_id()[]

  • name定位:driver.find_elements_by_name()[]

  • class定位:driver.find_elements_by_class_name()[]

  • link定位:driver.find_elements_by_link_text()[]

  • partial link定位:driver.find_elements_by_partial_link_text()[]

  • tag定位:driver.find_elements_by_tag_name()[]

  • css定位:driver.find_elements_by_css_selector()[]

  • xpath定位:driver.find_elements_by_xpath()[]

3、class定位

class定位主要是利用元素的css样式表所引用的伪类名称来进行元素查找,实际定位时,会经常发现一个元素的class name是由多个class组成的复合类,以空格隔开

class含空格解决办法有

(1)class属性唯一但有空格,选择空格两边唯一的那一个

(2)空格隔开的class不唯一,用索引定位

(3)通过css方法定位,空格用.代替

4、xpath定位

xpath就是XML path,可以用xpath来定位html文档中的任意元素,xpath定位是对整个文档进行扫描来定位元素,效率比较低

  • a.xpath有绝对路径和相对路径,绝对路径用/,相对路径用//

  • b.xpath以/开头表示让解析引擎从文档的根节点开始,以//开头表示让解析引擎从文档的任意符合的元素节点开始解析

  • c.xpath路径中有/表示寻找父节点的直接子节点,路径中有//表示寻找父节点所有符合的子节点

5、css定位

css定位和xpath定位类似,但是css执行速度比较快

6、xpath和css定位
在这里插入图片描述

三、等待

1、强制等待

强制等待就是不管程序是否加载完成,都需要等待对应的时间

#coding=utf-8
from selenium import webdriver
import time
driver=webdriver.Chrome()
driver.get('http://www.taobao.com')
time.sleep(5)
driver.quit()

2、隐式等待

隐式等待通过添加webdriver的implicitly_wait()方法,隐式等待设置了一个最长等待时间,如果在规定的时间内页面加载完成后,会立马执行下一步,否则会等待时间截止才执行下一步,隐式等待对webdriver整个周期起作用,所以只需要设置一次

'''
遇到问题没人解答?小编创建了一个Python学习交流QQ群:778463939
寻找有志同道合的小伙伴,互帮互助,群里还有不错的视频学习教程和PDF电子书!
'''
#coding=utf-8
from selenium import webdriver
import time
driver=webdriver.Chrome()
driver.get('http://www.taobao.com')
driver.implicitly_wait(10)
driver.quit()

3、显式等待

显式等待使用WebDriverWait,配合该类的until()或者until_not()方法,根据判断条件灵活等待,显式等待是程序每隔几秒检查一下条件是否成立,成立了则执行下一步,不成立则继续等待,直到超过了最长等待时间,再抛出异常

WebDriverWait调用方法:

WebDriverWait(driver,超时时长,调用频率,忽略异常).until(可执行方法,超时时返回的信息)

  • driver:WebDriver实例
  • timeout:超时时间

调用频率是调用until或until_not中的方法的间隔时间,默认是0.5秒
忽略的异常,如果在调用until或until_not的过程中抛出这个元组中的异常,则不中断代码,继续等待,如果抛出的是这个元组外的异常,则中断代码,抛出异常

until或者until_not的可执行方法参数一定要是可调用的,即一定要用call()方法,否则会抛出异常,可以用selenium提供的expected_conditions模块中的条件

#coding=utf-8
from selenium import webdriver
from selenium.webdriver.support.wait  import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
from selenium.webdriver.common.by import By
driver=webdriver.Chrome()
driver.get('http://www.taobao.com')
driver.implicitly_wait(10)
WebDriverWait(driver,5).until(EC.title_is(u"淘宝网 - 淘!我喜欢"))
#判断某个元素是否被加到dom树种,该元素不一定可见
WebDriverWait(driver,5).until(EC.presence_of_element_located((By.CSS_SELECTOR,'.btn-login.ml1.tb-bg.weight')))
#判断某个元素是否可见
WebDriverWait(driver,5).until(EC.visibility_of_element_located((By.CSS_SELECTOR,)))
#判断元素是否可见,传定位的element
WebDriverWait(driver,5).until(EC.visibility_of(driver.find_elements_by_css_selector('.btn-login.ml1.tb-bg.weight')),"未找到该元素")
driver.quit()

五、浏览器操作

'''
遇到问题没人解答?小编创建了一个Python学习交流QQ群:778463939
寻找有志同道合的小伙伴,互帮互助,群里还有不错的视频学习教程和PDF电子书!
'''
#coding=utf-8
from selenium import webdriver
import time
import os
driver=webdriver.Chrome()
driver.get('http://www.taobao.com')
driver.maximize_window()  #浏览器放大
time.sleep(5)
driver.get_screenshot_as_file('.\\1.png')  #截图
picture_time=time.strftime("%Y-%m-%d-%H_%M_%S", time.localtime(time.time()))
directory_time=time.strftime("%Y-%m-%d", time.localtime(time.time()))
try:
    File_Path = os.getcwd() + '\\' + directory_time + '\\'
    if not os.path.exists(File_Path):
        os.makedirs(File_Path)
        print("新建目录成功:%s" %File_Path)
    else:
        print("目录已存在")
except BaseException as msg:
    print("新建目录失败:%s" %msg)
driver.save_screenshot('.\\' + directory_time + '\\' + picture_time + '.png')  #截图
driver.quit()

六、键盘操作

调用键盘事件需要引入keys包

引入方法from selenium.webdriver.common.keys import Keys

通过send_keys()调用按键

send_keys(Keys.TAB)

send_keys(Keys.ENTER)

send_keys(Keys.CONTRAL,'a')

七、鼠标事件

需要引入ActionChains类

引入方法from selenium.webdriver.common.action_chains import ActionChains

ActionChains类常用方法:

perform() 执行所有ActionChains中存储的行为

context_click() 右击

double_click() 双击

drag_and_drop() 拖动

move_to_element() 鼠标悬停

相关文章

利用python同步windows和linux文件

写python脚本的初衷,每次在windows编辑完文件后,想同步到linux上去,只能够登录服务器,...

爬虫基本原理

爬虫基本原理 一、爬虫是什么? 百度百科和维基百科对网络爬虫的定义:简单来说爬虫就是抓取目标网站内容的工具,一般是根据定义的行...

Django 函数和方法的区别

函数和方法的区别 1、函数要手动传self,方法不用传 2、如果是一个函数,用类名去调用,如果是一个方法...

Django 知识补漏单例模式

单例模式:(说白了就是)创建一个类的实例。在 Python 中,我们可以用多种方法来实现单例模式&#x...

Django基础知识MTV

Django简介 Django是使用Python编写的一个开源Web框架。可以用它来快速搭建一个高性能的网站。 Django也是一个MVC框架。但是在Dj...

Python mysql 索引原理与慢查询优化

一 介绍 为何要有索引? 一般的应用系统,读写比例在10:1左右,而且插入操作和一般的更新操作很少出现性能问题,...

发表评论

访客

看不清,换一张

◎欢迎参与讨论,请在这里发表您的看法和观点。