真实的国产乱ⅩXXX66竹夫人,五月香六月婷婷激情综合,亚洲日本VA一区二区三区,亚洲精品一区二区三区麻豆

成都創(chuàng)新互聯(lián)網(wǎng)站制作重慶分公司

Python如何爬取高清桌面壁紙

Python如何爬取高清桌面壁紙,針對這個問題,這篇文章詳細介紹了相對應的分析和解答,希望可以幫助更多想解決這個問題的小伙伴找到更簡單易行的方法。

海門網(wǎng)站制作公司哪家好,找成都創(chuàng)新互聯(lián)!從網(wǎng)頁設計、網(wǎng)站建設、微信開發(fā)、APP開發(fā)、自適應網(wǎng)站建設等網(wǎng)站項目制作,到程序開發(fā),運營維護。成都創(chuàng)新互聯(lián)從2013年成立到現(xiàn)在10年的時間,我們擁有了豐富的建站經(jīng)驗和運維經(jīng)驗,來保證我們的工作的順利進行。專注于網(wǎng)站建設就選成都創(chuàng)新互聯(lián)。

直接運行即可,效果圖:

Python如何爬取高清桌面壁紙

代碼如下

導入工具

import requests,os
from pyquery import PyQuery as pq
import time

請求、解析網(wǎng)頁數(shù)據(jù),保存數(shù)據(jù)

 headers = {
    'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_11_4) AppleWebKit/537.36 '
                  '(KHTML, like Gecko) Chrome/52.0.2743.116 Safari/537.36'
}
# 這里我使用了代理  你可以去掉這個代理IP 我是為了后面大規(guī)模爬取做準備的
proxies = {
    'https': '218.75.69.50:39590'
}
 
# 請求網(wǎng)頁 獲取源碼
def start_request(url):
    r = requests.get(url, headers=headers, proxies=proxies)
    # 這個網(wǎng)站頁面使用的是GBK編碼 這里進行編碼轉(zhuǎn)換
    r.encoding = 'GBK'
    html = r.text
    return html
 
# 解析網(wǎng)頁 獲取圖片
def parse(text,i):
    doc = pq(text)
    # 鎖定頁面中的img標簽
    images = doc('div.list ul li img').items()
    x = 1
    for image in images:
        # 獲取每一張圖片的鏈接
        img_url = image.attr('src')
        # 獲得每張圖片的二進制內(nèi)容
        img = requests.get(img_url, headers=headers, proxies=proxies).content
        # 定義要存儲圖片的路勁
        # 創(chuàng)建目錄
        dir_path = os.path.dirname(os.path.abspath(__file__)) + "\\image\\"
        imagspath = dir_path+'/imgs'+str(i)
        # 創(chuàng)建目錄
        if not os.path.exists(imagspath):
            os.makedirs(imagspath)
 
        path = imagspath+"\\" + str(x) + ".jpg"
        # 將圖片寫入指定的目錄 寫入文件用"wb"
        with open(path, 'wb') as f:
            f.write(img)
            time.sleep(1)
            print("正在下載第{}頁{}張圖片".format(i,x))
            x += 1
    print("寫入完成")
 
def main():
    url = "http://www.netbian.com"
    text = start_request(url)
    parse(text,1)
    #爬取指定范圍頁面
    for i in range(2,100):
        urlnum = url + "/index_"+str(i)+".htm"
        textnum = start_request(urlnum)
        parse(textnum,i)
 
if __name__ == "__main__":
    main()

關于Python如何爬取高清桌面壁紙問題的解答就分享到這里了,希望以上內(nèi)容可以對大家有一定的幫助,如果你還有很多疑惑沒有解開,可以關注創(chuàng)新互聯(lián)行業(yè)資訊頻道了解更多相關知識。


當前題目:Python如何爬取高清桌面壁紙
轉(zhuǎn)載來源:http://weahome.cn/article/gdcegp.html

其他資訊

在線咨詢

微信咨詢

電話咨詢

028-86922220(工作日)

18980820575(7×24)

提交需求

返回頂部