這篇文章給大家分享的是有關(guān)怎么用Python爬蟲破解滑動(dòng)驗(yàn)證碼的內(nèi)容。小編覺得挺實(shí)用的,因此分享給大家做個(gè)參考,一起跟隨小編過來看看吧。
讓客戶滿意是我們工作的目標(biāo),不斷超越客戶的期望值來自于我們對(duì)這個(gè)行業(yè)的熱愛。我們立志把好的技術(shù)通過有效、簡(jiǎn)單的方式提供給客戶,將通過不懈努力成為客戶在信息化領(lǐng)域值得信任、有價(jià)值的長(zhǎng)期合作伙伴,公司提供的服務(wù)項(xiàng)目有:域名注冊(cè)、網(wǎng)絡(luò)空間、營(yíng)銷軟件、網(wǎng)站建設(shè)、天峨網(wǎng)站維護(hù)、網(wǎng)站推廣。
python的數(shù)據(jù)類型:1. 數(shù)字類型,包括int(整型)、long(長(zhǎng)整型)和float(浮點(diǎn)型)。2.字符串,分別是str類型和unicode類型。3.布爾型,Python布爾類型也是用于邏輯運(yùn)算,有兩個(gè)值:True(真)和False(假)。4.列表,列表是Python中使用最頻繁的數(shù)據(jù)類型,集合中可以放任何數(shù)據(jù)類型。5. 元組,元組用”()”標(biāo)識(shí),內(nèi)部元素用逗號(hào)隔開。6. 字典,字典是一種鍵值對(duì)的集合。7. 集合,集合是一個(gè)無序的、不重復(fù)的數(shù)據(jù)組合。
做爬蟲總會(huì)遇到各種各樣的反爬限制,反爬的第一道防線往往在登錄就出現(xiàn)了,為了限制爬蟲自動(dòng)登錄,各家使出了渾身解數(shù),所謂道高一尺魔高一丈。
今天分享個(gè)如何簡(jiǎn)單處理滑動(dòng)圖片的驗(yàn)證碼的案例。
類似這種拖動(dòng)滑塊移動(dòng)到圖片中缺口位置與之重合的登錄驗(yàn)證在很多網(wǎng)站或者APP都比較常見,因?yàn)樗鼘?duì)真實(shí)用戶體驗(yàn)友好,容易識(shí)別。同時(shí)也能攔截掉大部分初級(jí)爬蟲。
作為一只python爬蟲,如何正確地自動(dòng)完成這個(gè)驗(yàn)證過程呢?
先來分析下,核心問題其實(shí)是要怎么樣找到目標(biāo)缺口的位置,一旦知道了位置,我們就可以借用selenium等工具完成拖動(dòng)的操作。
我們可以借用opencv來解決這個(gè)問題,主要步驟:
opencv 是什么?
OpenCV(Open Source Computer Vision Library)是開放源代碼計(jì)算機(jī)視覺庫(kù),主要算法涉及圖像處理、計(jì)算機(jī)視覺和機(jī)器學(xué)習(xí)相關(guān)方法,可用于開發(fā)實(shí)時(shí)的圖像處理、計(jì)算機(jī)視覺以及模式識(shí)別程序。
直接安裝
首先將圖片進(jìn)行高斯模糊處理,高斯模糊的主要作用是減少圖像的噪聲,用于預(yù)處理階段。
處理后的效果
接著用Canny邊緣檢測(cè)到得到一個(gè)包含“窄邊界”的二值圖像。所謂二值圖像就是黑白圖,只有黑色和白色。
輪廓檢測(cè)
找出所有的輪廓,并用紅色線框?qū)⑵淅L制標(biāo)識(shí)出來了,看出來大大小小有幾十個(gè)輪廓
剩下的問題就好辦了,我們只需要對(duì)輪廓的面積或者周長(zhǎng)范圍做限制,就能過濾出目標(biāo)輪廓的位置, 前提是我們對(duì)目標(biāo)位置的輪廓大小是預(yù)先確定的。
輪廓的面積大概是6000到8000之間,周長(zhǎng)在300到500之間, 最后用外接矩形獲取該輪廓圖的坐標(biāo)位置和寬高大小。
如上就找到了目標(biāo)位置,剩下的工作就是將滑塊移動(dòng)到指定位置即可
感謝各位的閱讀!關(guān)于“怎么用Python爬蟲破解滑動(dòng)驗(yàn)證碼”這篇文章就分享到這里了,希望以上內(nèi)容可以對(duì)大家有一定的幫助,讓大家可以學(xué)到更多知識(shí),如果覺得文章不錯(cuò),可以把它分享出去讓更多的人看到吧!