這篇文章將為大家詳細(xì)講解有關(guān)Python獲取cookie的作用是什么,文章內(nèi)容質(zhì)量較高,因此小編分享給大家做個(gè)參考,希望大家閱讀完這篇文章后對(duì)相關(guān)知識(shí)有一定的了解。
站在用戶的角度思考問題,與客戶深入溝通,找到珙縣網(wǎng)站設(shè)計(jì)與珙縣網(wǎng)站推廣的解決方案,憑借多年的經(jīng)驗(yàn),讓設(shè)計(jì)與互聯(lián)網(wǎng)技術(shù)結(jié)合,創(chuàng)造個(gè)性化、用戶體驗(yàn)好的作品,建站類型包括:成都做網(wǎng)站、成都網(wǎng)站設(shè)計(jì)、企業(yè)官網(wǎng)、英文網(wǎng)站、手機(jī)端網(wǎng)站、網(wǎng)站推廣、域名申請(qǐng)、雅安服務(wù)器托管、企業(yè)郵箱。業(yè)務(wù)覆蓋珙縣地區(qū)。
cookie是什么?
Cookie,指某些網(wǎng)站為了辨別用戶身份、進(jìn)行session跟蹤而儲(chǔ)存在用戶本地終端上的數(shù)據(jù)(通常經(jīng)過加密)。在web開發(fā)中,經(jīng)常需要對(duì)會(huì)話進(jìn)行跟蹤。因?yàn)閔ttp請(qǐng)求是無狀態(tài)協(xié)議,也就是說僅僅通過http,服務(wù)器無法區(qū)分出不同的客戶端。也就是說你訪問這個(gè)頁面之后,在刷新一次,沒有cookie的話,服務(wù)器完全不知道現(xiàn)在刷新的和剛才訪問的是同一用戶,它都當(dāng)作是新的請(qǐng)求來處理,所以這就帶來了一定的不方便。特別是需要登錄的頁面,總不能每個(gè)頁面都登錄一次,每刷新一次就要登錄一次吧。也就是說需要某種機(jī)制來增強(qiáng)http協(xié)議,使得服務(wù)器可以區(qū)分出這是同一個(gè)客戶端。而這個(gè)機(jī)制就是cookie。
cookie如何工作
當(dāng)你第一次訪問某個(gè)網(wǎng)站的時(shí)候,服務(wù)器會(huì)給你頒發(fā)一個(gè)特定的cookie,之后你每次訪問這個(gè)站點(diǎn),你發(fā)送的請(qǐng)求頭里都會(huì)帶上相應(yīng)的cookie,這樣服務(wù)器便知道這倆請(qǐng)求是同一個(gè)客戶發(fā)送的。
第一次訪問某個(gè)網(wǎng)站,服務(wù)器會(huì)給你個(gè)cookie,response headers里有一個(gè)set-cookie 字段,就是告訴瀏覽器,把這個(gè)cookie放到本地,以后訪問我這個(gè)站點(diǎn)的時(shí)候,都把這個(gè)cookie帶上,我就知道你是誰了。
然后刷新頁面,相當(dāng)于第二次訪問
會(huì)發(fā)現(xiàn),第二次訪問的時(shí)候,response headers里邊已經(jīng)沒有這個(gè)set cookie字段了,但是request headers 里多了一個(gè)cookie字段,而且仔細(xì)觀察的話,你會(huì)發(fā)現(xiàn)這個(gè)值恰恰就是剛剛response headers set cookie字段的值。其實(shí)只要你不關(guān)閉瀏覽器,在打開一個(gè)窗口你會(huì)發(fā)現(xiàn)這個(gè)cookie值還是這個(gè),默認(rèn)情況下,關(guān)掉瀏覽器或者換一個(gè)瀏覽器,服務(wù)器就認(rèn)為這是一個(gè)新的會(huì)話了。而cookie的保存時(shí)間是可以設(shè)定的,你會(huì)發(fā)現(xiàn)知乎,簡(jiǎn)書等網(wǎng)站,只要你登陸成功之后,即使關(guān)閉瀏覽器,過幾天之后還是登陸狀態(tài),說明這個(gè)cookie是一個(gè)持久的cookie,保存時(shí)間比較長(zhǎng)。
從上述倆張圖,可以發(fā)現(xiàn)cookie是實(shí)實(shí)在在存在于http請(qǐng)求和響應(yīng)報(bào)頭的。
如何用python實(shí)現(xiàn)cookie登陸
既然大概明白了cookie機(jī)制,我們就嘗試用cookie進(jìn)行登陸。以登陸知乎為例,如果你用賬號(hào)密碼登陸,驗(yàn)證碼是個(gè)大問題,起碼目前對(duì)我來說是這樣,所以你先用瀏覽器手動(dòng)登陸知乎。右鍵進(jìn)入開發(fā)者選項(xiàng),network,選擇www.zhihu.com,查看請(qǐng)求頭信息。
然后把cookie復(fù)制下來,可以開始寫代碼了。
import requests from bs4 import BeautifulSoup headers={ 'User-Agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/61.0.3163.100 Safari/537.36', 'Referer':'https://www.zhihu.com/', 'Cookie':'q_c1=36160dc56c7d4cf3af14559e4ea69ed1|1508646188000|1508646188000; q_c1=e1adb01bc55343c0b61e0d4e08f73344| 1508646188000|1508646188000; _zap=7926df57-02e2-45a7-9244-85ff9156e100; d_c0="ABACCuGPkwyPTgYydZLhc0-YwrldDeOJ3_w=| 1508841150"; r_cap_id="NjE4YWExOTIxM2YwNGVlODhmNjc5ZDE3MGQyNWM0MjM=|1508844066| 4207fbc525684854cb948b64e10a3c693a999056"; cap_id="YzRhYmM5YTJhZWM4NGFiYWExOGYzOTU1ZjczMGMyOGI=|1508844066| a828518b3a798b99e4ea0cd6a54f25dc31d70c6d"; z_c0=Mi4xTk5WX0FnQUFBQUFBRUFJSzRZLVREQmNBQUFCaEFsVk5zM0RjV2dDWEhfTS16TmV1 dk80dTVZSnpqOGNpX3NpblF3|1508844211|c34b0d4374988f038beedfa2cbcd48e2271a0c66; __utma=51854390.9389312.1508841151. 1508841151.1508843285.2; __utmz=51854390.1508841151.1.1.utmcsr=baidu|utmccn=(organic)|utmcmd=organic; __utmv=51854390. 100-1|2=registration_date=20160120=1^3=entry_date=20160120=1; aliyungf_tc=AQAAAB0uB1XAWQIAE7YKcClINzXafvOI; _xsrf=3283d7f2-8e92-4b94-9b0e-1105c2d069d0' } res=requests.get("https://www.zhihu.com/search?type=content&q=java",headers=headers) soup=BeautifulSoup(res.text,'html.parser') n=soup.select(".list")[0].select(".item")
可以發(fā)現(xiàn),已經(jīng)抓到了本來需要登陸才能看的頁面,而如果去掉請(qǐng)求頭里的cookie字段,會(huì)幫你重定向到登陸頁面。
關(guān)于Python獲取cookie的作用是什么就分享到這里了,希望以上內(nèi)容可以對(duì)大家有一定的幫助,可以學(xué)到更多知識(shí)。如果覺得文章不錯(cuò),可以把它分享出去讓更多的人看到。