Python+Selenium+phantomjs怎么實現(xiàn)網(wǎng)頁模擬登錄和截圖

這篇文章主要介紹“Python+Selenium+phantomjs怎么實現(xiàn)網(wǎng)頁模擬登錄和截圖”，在日常操作中，相信很多人在Python+Selenium+phantomjs怎么實現(xiàn)網(wǎng)頁模擬登錄和截圖問題上存在疑惑，小編查閱了各式資料，整理出簡單好用的操作方法，希望對大家解答”Python+Selenium+phantomjs怎么實現(xiàn)網(wǎng)頁模擬登錄和截圖”的疑惑有所幫助！接下來，請跟著小編一起來學習吧！

我們提供的服務有：做網(wǎng)站、成都網(wǎng)站設計、微信公眾號開發(fā)、網(wǎng)站優(yōu)化、網(wǎng)站認證、萬柏林ssl等。為超過千家企事業(yè)單位解決了網(wǎng)站和推廣的問題。提供周到的售前咨詢和貼心的售后服務，是有科學管理、有技術的萬柏林網(wǎng)站制作公司

本文全部操作均在windows環(huán)境下

安裝 Python

Python是一種跨平臺的計算機程序設計語言，它可以運行在Windows、Mac和各種Linux/Unix系統(tǒng)上。是一種面向?qū)ο蟮膭討B(tài)類型語言，最初被設計用于編寫自動化腳本(shell)，隨著版本的不斷更新和語言新功能的添加，越來越多被用于獨立的、大型項目的開發(fā)

去Python的官網(wǎng) www.python.org 下載安裝

安裝時勾選pip (python包管理工具)，同時安裝pip

python安裝好之后，打開命令行工具cmd，輸入“python -V”,然后敲回車，如果出現(xiàn)python版本號，則表示安裝成功

安裝 selenium

selenium 是一個用于Web應用程序測試的工具。selenium測試直接運行在瀏覽器中，就像真正的用戶在操作一樣。支持的瀏覽器包括IE(7, 8, 9, 10, 11)，Mozilla Firefox，Safari，Google Chrome，Opera等。selenium 是一套完整的web應用程序測試系統(tǒng)，包含了測試的錄制(selenium IDE),編寫及運行(Selenium Remote Control)和測試的并行處理(Selenium Grid)

通過python包管理工具pip安裝

pip install selenium

安裝 phantomjs

phantomJS是一個基于webkit的javaScript API。它使用QtWebKit作為它核心瀏覽器的功能，使用webkit來編譯解釋執(zhí)行javaScript代碼。任何你可以基于在webkit瀏覽器做的事情，它都能做到。它不僅是個隱性的瀏覽器，提供了諸如css選擇器、支持wen標準、DOM操作、json、HTML5等，同時也提供了處理文件I/O的操作，從而使你可以向操作系統(tǒng)讀寫文件等。phantomJS的用處可謂非常廣泛諸如網(wǎng)絡監(jiān)測、網(wǎng)頁截屏、無需瀏覽器的wen測試、頁面訪問自動化等

phantomjs安裝鏈接 www.phantomjs.org

在桌面創(chuàng)建demo文件夾，創(chuàng)建demo.py文件，當做我們的腳本文件，創(chuàng)建img文件夾用來存放截取的圖片

demo.py：

# coding=utf-8

# 導入網(wǎng)頁驅(qū)動軟件

from selenium import webdriver

# 導入WebDriverWait等待模塊

from selenium.webdriver.support.wait import WebDriverWait

import time

# 調(diào)用環(huán)境變量指定的PhantomJS瀏覽器創(chuàng)建瀏覽器對象

# 括號內(nèi)為phantomjs安裝位置

driver = webdriver.PhantomJS(executable_path="D:\\Python27\\Scripts\\phantomjs-2.1.1-windows\\bin\\phantomjs.exe")

# 訪問的網(wǎng)址(以央視網(wǎng)為例)

driver.get("http://www.cctv.com/")

# 最大化瀏覽器

driver.maximize_window()

# 模擬點擊登錄按鈕登錄彈出登錄框(后面有定位元素方法介紹)

driver.find_elements_by_xpath('//span[@class="btn_icon"]')[1].click()

# 等待登錄頁面加載完成，WebDriverWait (后面有等待方法介紹)

WebDriverWait(driver, 10, 0.5).until(lambda diver:driver.find_element_by_xpath('//a[@class="dl"]'),message="")

time.sleep(2)

# 截取登錄框的頁面保存到相應位置

driver.save_screenshot('demo\\img\\login1.png')

# 定位登錄頁面用戶名和密碼元素并模擬填入用戶名和密碼

driver.find_element_by_name("username").send_keys('xxxxxxxxxxx')

driver.find_element_by_name("passwd_view").send_keys('xxxxxxxxxxx')

# 模擬點擊登錄按鈕登錄

driver.find_element_by_link_text('登錄').click()

WebDriverWait(driver, 10, 0.5).until(lambda diver:driver.find_elements_by_xpath('//span[@class="btn_icon"]'),message="")

time.sleep(2)

# 截取登錄后的頁面保存到相應位置

driver.save_screenshot('demo\\img\\login2.png')

# 模擬點擊按鈕跳轉(zhuǎn)體育頁面

driver.find_element_by_link_text('體育').click()

WebDriverWait(driver, 10, 0.5).until(lambda diver:driver.find_element_by_link_text('CBA'),message="")

time.sleep(2)

# 截取體育頁面保存到相應位置

driver.save_screenshot('demo\\img\\sport.png')

# 退出驅(qū)動關閉所有窗口

driver.quit()

運行python腳本

打開命令行窗口cmd，切換到demo.py文件的路徑下，輸入

python demo.py

腳本運行后會自動填寫我們設定好的用戶名密碼并登錄，截取設置好的頁面并保存到img文件夾

登錄框的頁面截圖：

登錄后的頁面截圖：

體育頁面截圖：

部分方法介紹：

區(qū)塊定位截圖(二次截圖)方法：

PIL(Python Image Library)是python的第三方圖像處理庫，PIL功能非常強大，API非常簡單易用，已經(jīng)是Python平臺事實上的圖像處理標準庫了。 PIL只支持python2.x的版本，python3.x的版本需要安裝pillow, pillow是一個對PIL友好的分支，但是支持python3.x的版本

python2.x版本下安裝PIL進行二次截圖

pip install PIL

python3.x版本下安裝pillow 進行區(qū)塊定位截圖

pip install pillow

demo.py:

# 導入Image類

from PIL import Image

# 定位需要二次截圖區(qū)塊的元素

img = driver.find_element_by_xpath('//*[@class="weui-img"]')

# 區(qū)塊元素左上角在網(wǎng)頁中的x坐標

left = img.location['x']

# 區(qū)塊元素左上角在網(wǎng)頁中的y坐標

top = img.location['y']

# 區(qū)塊元素右下角在網(wǎng)頁中的x坐標

right = img.location['x'] + img.size['width']

# 區(qū)塊元素右下角在網(wǎng)頁中的y坐標

bottom = img.location['y'] + img.size['height']

# 打開頁面的截圖

photo = Image.open('demo\\img\\img_page.png')

# 根據(jù)區(qū)塊元素坐標實現(xiàn)二次截圖

photo = photo.crop((left, top, right, bottom))

# 保存二次截圖鄭州人流醫(yī)院哪家好 http://m.zzzy120.com/

photo.save('demo\\img\\img.png')

WebDriver8種基本元素定位方法：

1. find_element_by_id() 根據(jù)id屬性進行定位

例如： find_element_by_id(“one”) 定位id為one的元素

2. find_element_by_name() 根據(jù)name屬性進行定位

例如： find_element_by_name(“one”) 定位name屬性為one的元素

3. find_element_by_class_name() 根據(jù)class的名字進行定位

例如： find_element_by_class_name(“one”) 定位class為one的元素

4. find_element_by_xpath() xpath是XML路徑語言，通過確定xml文檔中的元素位置來完成對元素的定位

例如： find_element_by_xpath("http://div[@id=‘one’]") 定位id為one的div元素

find_element_by_xpath("http://*[@class=‘two’]") 定位class為two的元素

5. find_element_by_css_selector() 根據(jù)css屬性進行定位

例如： find_element_by_css_selector("#one") 定位id為one的div元素

find_element_by_css_selector(".two") 定位class為two的元素

6. find_element_by_tag_name () 根據(jù)標簽名進行定位

例如： find_element_by_tag_name(“input”) 定位input元素

7. find_element_by_link_text() 根據(jù)完整a鏈接文字進行定位

find_element_by_partial_link_text() 根據(jù)部分a鏈接文字進行定位

例如： find_element_by_link_text(“新聞”) 定位文字為‘新聞’的a元素

find_element_by_partial_link_text(“聞”) 定位文字包括‘聞’的a元素

8. By定位

( 需要導入By類：from selenium.webdriver.common.by import By )

例如： find_element(By.ID,“one”) 定位id為one的元素

find_element(By.NAME,“one”) 定位name屬性為one的元素

find_element(By.CLASS_NAME,“one”) 定位class為one的元素

find_element(By.TAG_NAME,“div”) 定位div元素

當定位元素為多個時，使用elements復數(shù)定位，即把定位方法中的element換成elements，此時獲取到的為相同屬性的一組元素，返回一個list隊列，然后可以再去定位單個元素

例如： find_elements_by_class_name(“one”)[1] 定位class為one的所有元素中第二個元素

selenium的3種等待方法：

在做自動化測試時，有時下一步的操作會依賴上一步的結果或者內(nèi)容，上一步操作成功完成之后才能進行下一步操作，此時，我們就需要使用等待，來判斷上一步操作是否完成，進而執(zhí)行下面的操作，例如登錄頁面進行登錄操作時，需要等待登錄頁面加載成功，才能定位到用戶名和密碼對應的元素，然后才能填充用戶名和密碼，進行登錄操作。

1. 強制等待

time.sleep(s) 強制等待s秒后再進行下面的操作

缺點：不易把控時間，等待時間固定，如果沒到設置時間，已經(jīng)可以進行下面的操作，則需要多余的等待，如果到達設置時間，還沒完成上一步操作，下面的操作還無法正常進行，則會直接報錯

2. 隱式等待

implicitly_wait(s) 在s秒內(nèi)，上一步操作完成，進行下一步操作，否則等待s秒后，然后進行下一步操作

缺點：如果到達設置時間，還沒完成上一步操作，下面的操作還無法正常進行，則會直接報錯

3. 顯式等待(推薦使用)

WebDriverWait(driver,timeout,poll_frequency=0.5,ignored_exceptions=None)

等待頁面加載完成，找到某個條件發(fā)生后再繼續(xù)執(zhí)行后續(xù)代碼，如果超過設置時間檢測不到則拋出異常

driver：瀏覽器驅(qū)動

timeout：最長超時時間，默認以秒為單位

poll_frequency：檢測的間隔步長，默認為0.5s

ignored_exceptions：超時后的拋出的異常信息，默認拋出NoSuchElementExeception異常

與until()結合使用：

WebDriverWait(driver, s).until(method，message="")

在s秒內(nèi)，每0.5秒檢測一次，如果傳入的方法返回為true，進行下一步操作，如果到達設置時間未檢測到，下面的操作無法正常運行，則會直接報錯

到此，關于“Python+Selenium+phantomjs怎么實現(xiàn)網(wǎng)頁模擬登錄和截圖”的學習就結束了，希望能夠解決大家的疑惑。理論與實踐的搭配能更好的幫助大家學習，快去試試吧！若想繼續(xù)學習更多相關知識，請繼續(xù)關注創(chuàng)新互聯(lián)網(wǎng)站，小編會繼續(xù)努力為大家?guī)砀鄬嵱玫奈恼拢?/p>
本文名稱：Python+Selenium+phantomjs怎么實現(xiàn)網(wǎng)頁模擬登錄和截圖
URL分享：http://weahome.cn/article/jheddi.html

真实的国产乱ⅩXXX66竹夫人,五月香六月婷婷激情综合,亚洲日本VA一区二区三区,亚洲精品一区二区三区麻豆

Python+Selenium+phantomjs怎么實現(xiàn)網(wǎng)頁模擬登錄和截圖

其他資訊

網(wǎng)站制作

企業(yè)服務

網(wǎng)站建設

服務器托管