由于下學(xué)期報(bào)了一個(gè)Python的入門課程
十載的曲水網(wǎng)站建設(shè)經(jīng)驗(yàn),針對(duì)設(shè)計(jì)、前端、開(kāi)發(fā)、售后、文案、推廣等六對(duì)一服務(wù),響應(yīng)快,48小時(shí)及時(shí)工作處理。成都全網(wǎng)營(yíng)銷推廣的優(yōu)勢(shì)是能夠根據(jù)用戶設(shè)備顯示端的尺寸不同,自動(dòng)調(diào)整曲水建站的顯示方式,使網(wǎng)站能夠適用不同顯示終端,在瀏覽器中調(diào)整網(wǎng)站的寬度,無(wú)論在任何一種瀏覽器上瀏覽網(wǎng)站,都能展現(xiàn)優(yōu)雅布局與設(shè)計(jì),從而大程度地提升瀏覽體驗(yàn)。成都創(chuàng)新互聯(lián)從事“曲水網(wǎng)站設(shè)計(jì)”,“曲水網(wǎng)站推廣”以來(lái),每個(gè)客戶項(xiàng)目都認(rèn)真落實(shí)執(zhí)行。
所以寒假一直在自己摸索,畢竟到時(shí)候不能掛科,也是水水學(xué)分
最近心血來(lái)潮打算試試爬一下百度翻譯
肝了一天終于搞出來(lái)了
話不多說(shuō),直接開(kāi)搞(環(huán)境是Python 3.8 PyCharm Community Edition 2021.3.1)
基礎(chǔ)步驟
百度翻譯會(huì)識(shí)別到爬蟲(chóng),所以得用headers隱藏一下
以chorme瀏覽器為例
在百度翻譯頁(yè)面點(diǎn)擊鼠標(biāo)右鍵,選擇“檢查”(或者直接F12)
顯示以下界面
依次選Network-Fetch/XHR-Headers
然后就能看到我們需要的標(biāo)頭
我們需要的是Cookie和User-Agent,用于表示是特定用戶通過(guò)瀏覽器打開(kāi)此網(wǎng)站
也就是偽裝爬蟲(chóng)
然后我們復(fù)制到Pycharm當(dāng)中即可
1 headers = {"User-Agent": Your User-Agent, "Cookie": Your Cookie} 2 # 后面填寫你獲取到的User-Agent和Cookie即可