創(chuàng)新互聯(lián)www.cdcxhl.cn八線動(dòng)態(tài)BGP香港云服務(wù)器提供商,新人活動(dòng)買多久送多久,劃算不套路!
創(chuàng)新互聯(lián)是一家專注于成都做網(wǎng)站、網(wǎng)站制作和成都服務(wù)器托管的網(wǎng)絡(luò)公司,有著豐富的建站經(jīng)驗(yàn)和案例。python如何下載網(wǎng)頁源碼?針對這個(gè)問題,這篇文章詳細(xì)介紹了相對應(yīng)的分析和解答,希望可以幫助更多想解決這個(gè)問題的小伙伴找到更簡單易行的方法。
python可以下載網(wǎng)頁的源代碼,使用urllib庫,或者使用更為方便的requests庫。
import urllib2 def download(url, num_retries = 5): ''' function: 下載網(wǎng)頁源代碼,如果遇到 5xx 錯(cuò)誤狀態(tài),則繼續(xù)嘗試下載,直到下載 num_retries 次為止。 ''' print "downloading " , url try: html = urllib2.urlopen(url).read() except urllib2.URLError as e: print "download error: " , e.reason html = None if num_retries > 0: if hasattr(e,'code') and 500 <= e.code < 600: return download(url, num_retries-1) return html
其中 url 即為你想現(xiàn)在的網(wǎng)頁地址。 num_reties 為遇到 5xx 錯(cuò)誤的時(shí)候,重試下載的次數(shù)。
關(guān)于python如何下載網(wǎng)頁源碼問題的解答就分享到這里了,希望以上內(nèi)容可以對大家有一定的幫助,如果你還有很多疑惑沒有解開,可以關(guān)注創(chuàng)新互聯(lián)-成都網(wǎng)站建設(shè)公司行業(yè)資訊頻道了解更多相關(guān)知識(shí)。