了解python爬蟲之request怎么定義headers?這個(gè)問題可能是我們?nèi)粘W(xué)習(xí)或工作經(jīng)常見到的。希望通過這個(gè)問題能讓你收獲頗深。下面是小編給大家?guī)淼膮⒖純?nèi)容,讓我們一起來看看吧!
讓客戶滿意是我們工作的目標(biāo),不斷超越客戶的期望值來自于我們對(duì)這個(gè)行業(yè)的熱愛。我們立志把好的技術(shù)通過有效、簡(jiǎn)單的方式提供給客戶,將通過不懈努力成為客戶在信息化領(lǐng)域值得信任、有價(jià)值的長(zhǎng)期合作伙伴,公司提供的服務(wù)項(xiàng)目有:主機(jī)域名、網(wǎng)絡(luò)空間、營銷軟件、網(wǎng)站建設(shè)、陽明網(wǎng)站維護(hù)、網(wǎng)站推廣。
對(duì)于寫爬蟲來講,模擬瀏覽器是發(fā)請(qǐng)求的時(shí)候做的最多的事情了,最常見的模擬瀏覽器無非就是偽裝headers:
In [23]: url = 'http://xlzd.me' In [24]: headers = {'User-Agent': 'my custom user agent', 'Cookie': 'haha'} In [25]: requests.get(url, headers=headers)
拓展:
怎樣取出HTTP response里面的內(nèi)容呢?
In [7]: r = requests.get('http://xlzd.me') In [8]: r.encoding Out[8]: 'UTF-8' In [9]: r.headers Out[9]: {'Content-Encoding': 'gzip', 'Transfer-Encoding': 'chunked', 'Vary': 'Accept-Encoding', 'Server': 'nginx', 'Connection': 'keep-alive', 'Date': 'Fri, 11 Dec 2015 06:42:31 GMT', 'Content-Type': 'text/html; charset=UTF-8', 'X-Pingback': 'http://xlzd.me/action/xmlrpc'} In [10]: r.cookies Out[10]:In [11]: r.text Out[11]: u'\n\n\t requests會(huì)自動(dòng)對(duì)響應(yīng)內(nèi)容編碼,所以就可以通過r.text取出響應(yīng)文本了。對(duì)于別等響應(yīng)內(nèi)容(文件、圖片、...),則可以通過r.content取出來。對(duì)于json內(nèi)容,也可以通過r.json()來取。
感謝各位的閱讀!看完上述內(nèi)容,你們對(duì)python爬蟲之request怎么定義headers大概了解了嗎?希望文章內(nèi)容對(duì)大家有所幫助。如果想了解更多相關(guān)文章內(nèi)容,歡迎關(guān)注創(chuàng)新互聯(lián)行業(yè)資訊頻道。
當(dāng)前名稱:python爬蟲之request怎么定義headers
分享URL:http://weahome.cn/article/gchgpi.html