真实的国产乱ⅩXXX66竹夫人,五月香六月婷婷激情综合,亚洲日本VA一区二区三区,亚洲精品一区二区三区麻豆

成都創(chuàng)新互聯(lián)網(wǎng)站制作重慶分公司

一個很水的Python代碼分析

本篇內(nèi)容主要講解“一個很水的Python代碼分析”,感興趣的朋友不妨來看看。本文介紹的方法操作簡單快捷,實用性強。下面就讓小編來帶大家學(xué)習(xí)“一個很水的Python代碼分析”吧!

創(chuàng)新互聯(lián)公司專注為客戶提供全方位的互聯(lián)網(wǎng)綜合服務(wù),包含不限于網(wǎng)站設(shè)計、成都做網(wǎng)站、成都網(wǎng)絡(luò)推廣、成都小程序開發(fā)、成都網(wǎng)絡(luò)營銷、成都企業(yè)策劃、成都品牌公關(guān)、搜索引擎seo、人物專訪、企業(yè)宣傳片、企業(yè)代運營等,從售前售中售后,我們都將竭誠為您服務(wù),您的肯定,是我們最大的嘉獎;創(chuàng)新互聯(lián)公司為所有大學(xué)生創(chuàng)業(yè)者提供成都建站搭建服務(wù),24小時服務(wù)熱線:028-86922220,官方網(wǎng)址:www.cdcxhl.com

# _ * _編碼:UTF-8 _ * _
“””xianhu的python_spider.py“””
導(dǎo)入請求import urllib.errorimport urllib.parseimport urllib.request導(dǎo)入 http.cookiejar

第一段

#首先定義下邊可能需要的變量
url =  “ https://www.baidu.com ”headers = { “ User-Agent ”:“ Mozilla / 4.0(兼容; MSIE 5.5; Windows NT)” }
#最簡單的網(wǎng)頁抓取方式
response = urllib.request.urlopen(url,timeout = 10)
html = response.read()。decode(“ utf-8 ”)
#使用請求實例代替網(wǎng)址
request = urllib.request.Request(url,data = None,headers = {})
response = urllib.request.urlopen(request,timeout = 10)

第二段

#發(fā)送數(shù)據(jù),即在請求()中添加數(shù)據(jù)參數(shù)
data = urllib.parse.urlencode({ “ act ”:“ login ”,“ email ”:“ xianhu@qq.com ”,“ password ”:“ 123456 ” })
request1 = urllib.request.Request(URL,數(shù)據(jù)=數(shù)據(jù))            # POST方法
請求2 = urllib.request.Request(URL + “?%S ” %數(shù)據(jù))          # GET方法
response = urllib.request.urlopen(request,timeout = 10)
#發(fā)送報頭,即在請求()中添加報頭參數(shù)
request = urllib.request.Request(url,data = data,headers = headers)    #參數(shù)中添加header參數(shù)
request.add_header(“ Referer ”,“ http://www.baidu.com ”)                #另一種添加header的方式,添加Referer是為了應(yīng)對“反盜鏈”response = urllib.request.urlopen(request,timeout = 10)

第三段

#網(wǎng)頁抓取引發(fā)異常:urllib.error.HTTPError,urllib.error.URLError,兩者存在繼承關(guān)系
嘗試:
    urllib.request.urlopen(request,timeout = 10)
除了 urllib.error.HTTPError 為 e:
    打印(e.code,e.reason)
除了 urllib.error.URLError 為 e:
    打?。╡.errno,e.reason)
#使用代理,以防止IP被封或IP次數(shù)受限:
proxy_handler = urllib.request.ProxyHandler(proxies = { “ http ”:“ 111.123.76.12:8080 ” })
opener = urllib.request.build_opener(proxy_handler)      #利用代理創(chuàng)建opener實例
響應(yīng)= opener.open(URL)                             #直接利用開啟器實例打開URL
urllib.request.install_opener(opener)                    #安裝全局opener,然后利用urlopen打開網(wǎng)址
response = urllib.request.urlopen(url)

第四段

#使用餅干和cookiejar,應(yīng)對服務(wù)器檢查
cookie_jar = http.cookiejar.CookieJar()
cookie_jar_handler = urllib.request.HTTPCookieProcessor(cookiejar = cookie_jar)
opener = urllib.request.build_opener(cookie_jar_handler)
response = opener.open(url)
#發(fā)送在瀏覽器中獲取的餅干,兩種方式:
#(1)直接放到headers里
headers = {
    “ User-Agent ”: “ Mozilla / 4.0(兼容; MSIE 5.5; Windows NT)”,
    “ Cookie ”: “ PHPSESSID = btqkg9amjrtoeev8coq0m78396; USERINFO = n6nxTHTY%2BJA39z6CpNB4eKN8f0KsYLjAQTwPe%2BhLHLruEbjaeh5ulhWAS5RysUM%2B; ”
}
request = urllib.request.Request(url,headers = headers)
#(2)構(gòu)建cookie,添加到cookiejar中
cookie = http.cookiejar.Cookie(name = “ xx ”,value = “ xx ”,domain = “ xx ”,...)
cookie_jar.set_cookie(餅干)
response = opener.open(url)
#同時使用代理和cookiejar
opener = urllib.request.build_opener(cookie_jar_handler)
opener.add_handler(proxy_handler)
response = opener.open(“ https://www.baidu.com/ ”)#抓取網(wǎng)頁中的圖片:同樣適用于抓取網(wǎng)絡(luò)上的文件右擊鼠標,找到圖片屬性中的地址,然后進行保存。
response = urllib.request.urlopen(“ http://ww3.sinaimg.cn/large/7d742c99tw1ee7dac2766j204q04qmxq.jpg ”,超時= 120)使用 open(“ test.jpg ”,“ wb ”)作為 file_img:
    file_img.write(response.read())
# HTTP認證:即HTTP身份驗證
password_mgr = urllib.request.HTTPPasswordMgrWithDefaultRealm()      #創(chuàng)建一個PasswordMgr
password_mgr.add_password(realm = None,uri = url,user = ' username ',passwd = ' password ')    #添加用戶名和密碼
handler = urllib.request.HTTPBasicAuthHandler(password_mgr)          #創(chuàng)建HTTPBasicAuthHandler
opener = urllib.request.build_opener(handler)                        #創(chuàng)建opner
response = opener.open(url,timeout = 10)                              #獲取數(shù)據(jù)
#使用套接字代理
進口襪子
導(dǎo)入套接字
socks.setdefaultproxy(socks.PROXY_TYPE_SOCKS5,“ 127.0.0.1 ”,1080)
socket.socket = socks.socksocket
requests.get(“ http://www.baidu.com/s?ie=utf-8&wd=ip ”)

到此,相信大家對“一個很水的Python代碼分析”有了更深的了解,不妨來實際操作一番吧!這里是創(chuàng)新互聯(lián)網(wǎng)站,更多相關(guān)內(nèi)容可以進入相關(guān)頻道進行查詢,關(guān)注我們,繼續(xù)學(xué)習(xí)!


分享題目:一個很水的Python代碼分析
轉(zhuǎn)載來于:http://weahome.cn/article/gpgcjs.html

其他資訊

在線咨詢

微信咨詢

電話咨詢

028-86922220(工作日)

18980820575(7×24)

提交需求

返回頂部