真实的国产乱ⅩXXX66竹夫人,五月香六月婷婷激情综合,亚洲日本VA一区二区三区,亚洲精品一区二区三区麻豆

成都創(chuàng)新互聯(lián)網(wǎng)站制作重慶分公司

selenium+chromedriver在服務(wù)器運(yùn)行的示例分析

這篇文章將為大家詳細(xì)講解有關(guān)selenium+chromedriver在服務(wù)器運(yùn)行的示例分析,小編覺(jué)得挺實(shí)用的,因此分享給大家做個(gè)參考,希望大家閱讀完這篇文章后可以有所收獲。

察布查爾錫伯ssl適用于網(wǎng)站、小程序/APP、API接口等需要進(jìn)行數(shù)據(jù)傳輸應(yīng)用場(chǎng)景,ssl證書(shū)未來(lái)市場(chǎng)廣闊!成為創(chuàng)新互聯(lián)公司的ssl證書(shū)銷售渠道,可以享受市場(chǎng)價(jià)格4-6折優(yōu)惠!如果有意向歡迎電話聯(lián)系或者加微信:028-86922220(備注:SSL證書(shū)合作)期待與您的合作!

1.前言

想使用selenium從網(wǎng)站上抓數(shù)據(jù),但有時(shí)候使用phantomjs會(huì)出錯(cuò)。chrome現(xiàn)在也有無(wú)界面運(yùn)行模式了,以后就可以不用phantomjs了。

但在服務(wù)器安裝chrome時(shí)出現(xiàn)了一些錯(cuò)誤,這里總結(jié)一下整個(gè)安裝過(guò)程

2.ubuntu上安裝chrome

# Install Google Chrome
# https://askubuntu.com/questions/79280/how-to-install-chrome-browser-properly-via-command-line
sudo apt-get install libxss1 libappindicator1 libindicator7
wget https://dl.google.com/linux/direct/google-chrome-stable_current_amd64.deb
sudo dpkg -i google-chrome*.deb # Might show "errors", fixed by next line
sudo apt-get install -f

這時(shí)應(yīng)該已經(jīng)安裝好了,用下邊的命行運(yùn)行測(cè)試一下:

google-chrome --headless --remote-debugging-port=9222 https://chromium.org --disable-gpu

這里是使用headless模式進(jìn)行遠(yuǎn)程調(diào)試,ubuntu上大多沒(méi)有g(shù)pu,所以–disable-gpu以免報(bào)錯(cuò)。
之后可以再打開(kāi)一個(gè)ssh連接到服務(wù)器,使用命令行訪問(wèn)服務(wù)器的本地的9222端口:

curl http://localhost:9222

如果安裝好了,會(huì)看到調(diào)試信息。但我這里會(huì)報(bào)一個(gè)錯(cuò)誤,下邊是錯(cuò)誤的解決辦法。

1)可能的錯(cuò)誤解決方法

運(yùn)行完上邊的命令可能會(huì)報(bào)一個(gè)不能在root下運(yùn)行chrome的錯(cuò)誤。這個(gè)時(shí)候使用下邊方設(shè)置一下chrome

1.找到google-chrome文件

我的位置位于/opt/google/chrome/

2.用vi打開(kāi)google-chrome文件

vi /opt/google/chrome/google-chrome

在文件中找到

exec -a "$0" "$HERE/chrome" "$@"

3.在后面添加 –user-data-dir –no-sandbox即可,整條shell命令就是

exec -a "$0" "$HERE/chrome" "$@" --user-data-dir --no-sandbox

4.再重新打開(kāi)google-chrome即可正常訪問(wèn)!

3.安裝chrome驅(qū)動(dòng)chromedriver

下載chromedriver

chromedriver提供了操作chrome的api,是selenium控制chrome的橋梁。

chromedriver最好安裝最新版的,記的我一開(kāi)始安裝的不是最新版的,會(huì)報(bào)一個(gè)錯(cuò)。用最新版的chromedriver就沒(méi)有問(wèn)題,最新版的可以在下邊地址找到
https://sites.google.com/a/chromium.org/chromedriver/downloads

我寫(xiě)這個(gè)文章時(shí)最新版是2.37

wget https://chromedriver.storage.googleapis.com/2.37/chromedriver_linux64.zip
unzip chromedriver_linux64.zip

到這里服務(wù)器端的無(wú)界面版chrome就安裝好了。

4.無(wú)界面版chrome使用方法

from selenium import webdriver
chrome_options = webdriver.ChromeOptions()
chrome_options.add_argument('--headless')
chrome_options.add_argument('--disable-gpu')
chrome_options.add_argument("user-agent='Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/62.0.3202.94 Safari/537.36'")
wd = webdriver.Chrome(chrome_options=chrome_options,executable_path='/home/chrome/chromedriver')

wd.get("https://www.163.com")

content = wd.page_source.encode('utf-8')
print content

wd.quit()

這里chrome_options中的第三項(xiàng)設(shè)置參數(shù),使用這個(gè)設(shè)置可以避免網(wǎng)站檢測(cè)到你使用的是無(wú)界模式進(jìn)行反抓取。

下邊另外的兩項(xiàng)設(shè)置,不進(jìn)行設(shè)置時(shí)在桌面版linux系統(tǒng),或者mac系統(tǒng)上會(huì)打開(kāi)有界面的chrome.調(diào)試時(shí)可以注釋掉下邊兩行使用有界面版chrome來(lái)調(diào)試程序。

chrome_options.add_argument('--headless')
chrome_options.add_argument('--disable-gpu')

關(guān)于“selenium+chromedriver在服務(wù)器運(yùn)行的示例分析”這篇文章就分享到這里了,希望以上內(nèi)容可以對(duì)大家有一定的幫助,使各位可以學(xué)到更多知識(shí),如果覺(jué)得文章不錯(cuò),請(qǐng)把它分享出去讓更多的人看到。


當(dāng)前標(biāo)題:selenium+chromedriver在服務(wù)器運(yùn)行的示例分析
瀏覽路徑:http://weahome.cn/article/jhcees.html

其他資訊

在線咨詢

微信咨詢

電話咨詢

028-86922220(工作日)

18980820575(7×24)

提交需求

返回頂部