這篇文章給大家分享的是有關(guān)Python制作批量爬取網(wǎng)絡(luò)圖片的方法的內(nèi)容。小編覺得挺實(shí)用的,因此分享給大家做個(gè)參考。一起跟隨小編過來看看吧。
為來賓等地區(qū)用戶提供了全套網(wǎng)頁設(shè)計(jì)制作服務(wù),及來賓網(wǎng)站建設(shè)行業(yè)解決方案。主營業(yè)務(wù)為成都網(wǎng)站建設(shè)、網(wǎng)站設(shè)計(jì)、來賓網(wǎng)站設(shè)計(jì),以傳統(tǒng)方式定制建設(shè)網(wǎng)站,并提供域名空間備案等一條龍服務(wù),秉承以專業(yè)、用心的態(tài)度為用戶提供真誠的服務(wù)。我們深信只要達(dá)到每一位用戶的要求,就會(huì)得到認(rèn)可,從而選擇與我們長期合作。這樣,我們也可以走得更遠(yuǎn)!
Python爬蟲爬圖片需要什么?下面用兩種方法制作批量爬取網(wǎng)絡(luò)圖片的方法:
第一種方法:基于urllib實(shí)現(xiàn)
要點(diǎn)如下:
1.url_request = request.Request(url)
2.url_response = request.urlopen(url) 或者 url_response = request.urlopen(url_request)
3.data=url_response .read().decode('utf-8')
4.jpglist=re.findall(正則表達(dá)式,data)
5.request.urlretrieve(jpgUrl,'%s.jpg' %n) #下載,第一個(gè)參數(shù)網(wǎng)址,第二參數(shù)名稱
第一個(gè)案例,我們爬取了貓撲上的一個(gè)網(wǎng)頁上的圖片,案例代碼如下。
需要說明的是代碼request.urlretrieve(each,'pic2\\%s.jpg' %n)中“pic2\\”代表下載的圖片放置在提前建好的文件夾pic2里。運(yùn)行代碼結(jié)束之后IDLE和最后結(jié)果如下圖所示。
第二種實(shí)現(xiàn)方法:基于requests實(shí)現(xiàn)
要點(diǎn)如下:
1.data=requests.get(url).text
2.jpglist=re.findall(正則表達(dá)式,data,re.S)
3.pic=requests.get(pic_url,timeout=10)
4. fp=open(pic_name,'wb')
fp.write(pic.content)
fp.close()
在這個(gè)案例中我們爬取了一個(gè)壁紙網(wǎng)站的網(wǎng)頁,預(yù)測(cè)應(yīng)該圖片質(zhì)量比較高吧。完整代碼如下:
我們來看一下運(yùn)行代碼的結(jié)果,如下圖所示。真心不錯(cuò),我們獲得了42張壁紙,而且是在短短幾秒鐘內(nèi)完成的。
感謝各位的閱讀!關(guān)于Python制作批量爬取網(wǎng)絡(luò)圖片的方法就分享到這里了,希望以上內(nèi)容可以對(duì)大家有一定的幫助,讓大家可以學(xué)到更多知識(shí)。如果覺得文章不錯(cuò),可以把它分享出去讓更多的人看到吧!