真实的国产乱ⅩXXX66竹夫人,五月香六月婷婷激情综合,亚洲日本VA一区二区三区,亚洲精品一区二区三区麻豆

成都創(chuàng)新互聯(lián)網(wǎng)站制作重慶分公司

Python怎么爬取網(wǎng)頁(yè)天氣預(yù)報(bào)

這篇文章將為大家詳細(xì)講解有關(guān)Python怎么爬取網(wǎng)頁(yè)天氣預(yù)報(bào),文章內(nèi)容質(zhì)量較高,因此小編分享給大家做個(gè)參考,希望大家閱讀完這篇文章后對(duì)相關(guān)知識(shí)有一定的了解。

網(wǎng)站設(shè)計(jì)制作過(guò)程拒絕使用模板建站;使用PHP+MYSQL原生開(kāi)發(fā)可交付網(wǎng)站源代碼;符合網(wǎng)站優(yōu)化排名的后臺(tái)管理系統(tǒng);網(wǎng)站建設(shè)、成都做網(wǎng)站收費(fèi)合理;免費(fèi)進(jìn)行網(wǎng)站備案等企業(yè)網(wǎng)站建設(shè)一條龍服務(wù).我們是一家持續(xù)穩(wěn)定運(yùn)營(yíng)了10余年的創(chuàng)新互聯(lián)網(wǎng)站建設(shè)公司。

爬蟲簡(jiǎn)單說(shuō)來(lái)包括兩個(gè)步驟:獲得網(wǎng)頁(yè)文本、過(guò)濾得到數(shù)據(jù)。 爬蟲獲取網(wǎng)頁(yè)天氣信息也可以按照這個(gè)步驟做:

1、獲得html文本。 

python在獲取html方面十分方便,寥寥數(shù)行代碼就可以實(shí)現(xiàn)我們需要的功能。 

代碼如下:

def getHtml(url): 
page = urllib.urlopen(url) 
html = page.read() 
page.close() 
return html

這么幾行代碼相信不用注釋都能大概知道它的意思。 

2、根據(jù)正則表達(dá)式等獲得需要的內(nèi)容。

使用正則表達(dá)式時(shí)需要仔細(xì)觀察該網(wǎng)頁(yè)信息的結(jié)構(gòu),并寫出正確的正則表達(dá)式。 

python正則表達(dá)式的使用也很簡(jiǎn)潔。我的上一篇文章《Python的一些用法》介紹了一點(diǎn)正則的用法。這里需要一個(gè)新的用法: 

代碼如下:

def getWeather(html): 
reg = '(.*?).*?(.*?).*?(.*?)' 
weatherList = re.compile(reg).findall(html) 
return weatherList

其中reg是正則表達(dá)式,html是第一步獲得的文本。findall的作用是找到html中所有符合正則匹配的字符串并存放到weatherList中。之后再枚舉weatheList中的數(shù)據(jù)輸出即可。 

這里的正則表達(dá)式reg有兩個(gè)地方要注意。 

一個(gè)是“(.*?)”。只要是()中的內(nèi)容都是我們將要獲得的內(nèi)容,如果有多個(gè)括號(hào),那么findall的每個(gè)結(jié)果就都包含這幾個(gè)括號(hào)中的內(nèi)容。上面有三個(gè)括號(hào),分別對(duì)應(yīng)城市、最低溫和最高溫。 

另一個(gè)是“.*?”。python的正則匹配默認(rèn)是貪婪的,即默認(rèn)盡可能多地匹配字符串。如果在末尾加上問(wèn)號(hào),則表示非貪婪模式,即盡可能少地匹配字符串。在這里,由于有多個(gè)城市的信息需要匹配,所以需要使用非貪婪模式,否則匹配結(jié)果只剩下一個(gè),且是不正確的。 

關(guān)于Python怎么爬取網(wǎng)頁(yè)天氣預(yù)報(bào)就分享到這里了,希望以上內(nèi)容可以對(duì)大家有一定的幫助,可以學(xué)到更多知識(shí)。如果覺(jué)得文章不錯(cuò),可以把它分享出去讓更多的人看到。


網(wǎng)頁(yè)題目:Python怎么爬取網(wǎng)頁(yè)天氣預(yù)報(bào)
當(dāng)前地址:http://weahome.cn/article/gejhod.html

其他資訊

在線咨詢

微信咨詢

電話咨詢

028-86922220(工作日)

18980820575(7×24)

提交需求

返回頂部