小編給大家分享一下使用python爬蟲怎么處理有密碼的網(wǎng)站,相信大部分人都還不怎么了解,因此分享這篇文章給大家參考一下,希望大家閱讀完這篇文章后大有收獲,下面讓我們一起去了解一下吧!
創(chuàng)新互聯(lián)公司2013年至今,先為太子河等服務(wù)建站,太子河等地企業(yè),進(jìn)行企業(yè)商務(wù)咨詢服務(wù)。為太子河企業(yè)網(wǎng)站制作PC+手機(jī)+微官網(wǎng)三網(wǎng)同步一站式服務(wù)解決您的所有建站問題。
步驟一:查看要爬取的網(wǎng)站信息
進(jìn)入登錄頁面 。你會(huì)看到如下圖所示的頁面。
然后進(jìn)行查看元素,查看到name、password,最終我們得到以下內(nèi)容
payload = { "username": "", "password": " ", "csrfmiddlewaretoken": " " }
步驟二、配置網(wǎng)站登錄設(shè)置
創(chuàng)建一個(gè)登錄對象。
session_requests = requests.session()
設(shè)置一個(gè)登錄的url
result = session_requests.post( login_url, data = payload, headers = dict(referer=login_url) )
步驟三、爬取信息內(nèi)容
到了這個(gè)步驟,我們已經(jīng)成功進(jìn)行登錄了,用以下方式進(jìn)行爬?。?/p>
url = '鏈接' result = session_requests.get( url, headers = dict(referer = url) )
以上是“使用python爬蟲怎么處理有密碼的網(wǎng)站”這篇文章的所有內(nèi)容,感謝各位的閱讀!相信大家都有了一定的了解,希望分享的內(nèi)容對大家有所幫助,如果還想學(xué)習(xí)更多知識(shí),歡迎關(guān)注創(chuàng)新互聯(lián)行業(yè)資訊頻道!