這篇文章主要介紹了Python3爬蟲中PhantomJS的安裝方法是什么,具有一定借鑒價值,需要的朋友可以參考下。希望大家閱讀完這篇文章后大有收獲。下面讓小編帶著大家一起了解一下。
成都創(chuàng)新互聯(lián)專注于企業(yè)成都全網(wǎng)營銷推廣、網(wǎng)站重做改版、善右網(wǎng)站定制設(shè)計、自適應(yīng)品牌網(wǎng)站建設(shè)、html5、商城系統(tǒng)網(wǎng)站開發(fā)、集團公司官網(wǎng)建設(shè)、成都外貿(mào)網(wǎng)站制作、高端網(wǎng)站制作、響應(yīng)式網(wǎng)頁設(shè)計等建站業(yè)務(wù),價格優(yōu)惠性價比高,為善右等各大城市提供網(wǎng)站開發(fā)制作服務(wù)。
PhantomJS是一個無界面的、可腳本編程的WebKit瀏覽器引擎,它原生支持多種Web標(biāo)準(zhǔn):DOM操作、CSS選擇器、JSON、Canvas以及SVG。
Selenium支持PhantomJS,這樣在運行的時候就不會再彈出一個瀏覽器了。而且PhantomJS的運行效率也很高,還支持各種參數(shù)配置,使用非常方便。下面我們就來了解一下PhantomJS的安裝過程。
1. 相關(guān)鏈接
官方網(wǎng)站:http://phantomjs.org
官方文檔:http://phantomjs.org/quick-start.html
下載地址:http://phantomjs.org/download.html
API接口說明:http://phantomjs.org/api/command-line.html
2. 下載PhantomJS
我們需要在官方網(wǎng)站下載對應(yīng)的安裝包,PhantomJS支持多種操作系統(tǒng),比如Windows、Linux、Mac、FreeBSD等,我們可以選擇對應(yīng)的平臺并將安裝包下載下來。
下載完成后,將PhantomJS可執(zhí)行文件所在的路徑配置到環(huán)境變量里。比如在Windows下,將下載的文件解壓之后并打開,會看到一個bin文件夾,里面包括一個可執(zhí)行文件phantomjs.exe,我們需要將它直接放在配置好環(huán)境變量的路徑下或者將它所在的路徑配置到環(huán)境變量里。比如,我們既可以將它直接復(fù)制到Python的Scripts文件夾,也可以將它所在的bin目錄加入到環(huán)境變量。
Windows下環(huán)境變量的配置可以參見1.1節(jié),Linux及Mac環(huán)境變量的配置可以參見1.2.3節(jié),在此不再贅述,關(guān)鍵在于將PhantomJS的可執(zhí)行文件所在路徑配置到環(huán)境變量里。
配置成功后,可以在命令行下測試一下,輸入:
phantomjs
如果可以進入到PhantomJS的命令行,那就證明配置完成了,如圖1-21所示。
圖1-21 控制臺
3. 驗證安裝
在Selenium中使用的話,我們只需要將Chrome切換為PhantomJS即可:
from selenium import webdriver browser = webdriver.PhantomJS() browser.get('https://www.baidu.com') print(browser.current_url)
運行之后,我們就不會發(fā)現(xiàn)有瀏覽器彈出了,但實際上PhantomJS已經(jīng)運行起來了。這里我們訪問了百度,然后將當(dāng)前的URL打印出來。
控制臺的輸出如下:
https://www.baidu.com/
如此一來,我們便完成了PhantomJS的配置,后面可以利用它來完成一些頁面的抓取。
這里我們介紹了Selenium對應(yīng)的三大主流瀏覽器的對接方式,后面我們會對Selenium及各個瀏覽器的對接方法進行更加深入的探究。
感謝你能夠認(rèn)真閱讀完這篇文章,希望小編分享Python3爬蟲中PhantomJS的安裝方法是什么內(nèi)容對大家有幫助,同時也希望大家多多支持創(chuàng)新互聯(lián),關(guān)注創(chuàng)新互聯(lián)行業(yè)資訊頻道,遇到問題就找創(chuàng)新互聯(lián),詳細(xì)的解決方法等著你來學(xué)習(xí)!