這篇文章將為大家詳細(xì)講解有關(guān)python下載網(wǎng)頁的方法,小編覺得挺實(shí)用的,因此分享給大家做個(gè)參考,希望大家閱讀完這篇文章后可以有所收獲。
創(chuàng)新互聯(lián)公司專業(yè)為企業(yè)提供南潯網(wǎng)站建設(shè)、南潯做網(wǎng)站、南潯網(wǎng)站設(shè)計(jì)、南潯網(wǎng)站制作等企業(yè)網(wǎng)站建設(shè)、網(wǎng)頁設(shè)計(jì)與制作、南潯企業(yè)網(wǎng)站模板建站服務(wù),10余年南潯做網(wǎng)站經(jīng)驗(yàn),不只是建網(wǎng)站,更提供有價(jià)值的思路和整體網(wǎng)絡(luò)服務(wù)。
python下載網(wǎng)頁的方法:
直接使用下面的代碼即可下載一個(gè)網(wǎng)頁:
import urllib.request def getHtml(url): html = urllib.request.urlopen(url).read() return html def saveHtml(file_name, file_content): # 注意windows文件命名的禁用符,比如 / with open(file_name.replace('/', '_') + ".html", "wb") as f: # 寫文件用bytes而不是str,所以要轉(zhuǎn)碼 f.write(file_content) aurl = "https://www.py.cn/faq/python/18220.html" html = getHtml(aurl) saveHtml("sduview", html) print("下載成功")
下載文件如下:
程序主要有兩個(gè)函數(shù),第一個(gè)getHtml(url) 功能為打開一個(gè)url網(wǎng)絡(luò)鏈接,把鏈接的內(nèi)容讀取出來,存在html變量里;第二個(gè)saveHtml(file_name,file_content) 功能為打開一個(gè)名為 file_name 的文件,把網(wǎng)頁內(nèi)容寫進(jìn)去。
關(guān)于python下載網(wǎng)頁的方法就分享到這里了,希望以上內(nèi)容可以對(duì)大家有一定的幫助,可以學(xué)到更多知識(shí)。如果覺得文章不錯(cuò),可以把它分享出去讓更多的人看到。