把寫代碼過程中經(jīng)常用到的一些代碼段珍藏起來,下面的代碼段是關(guān)于python解析遠(yuǎn)程web頁面的代碼。
成都創(chuàng)新互聯(lián)公司為客戶提供專業(yè)的網(wǎng)站制作、成都做網(wǎng)站、程序、域名、空間一條龍服務(wù),提供基于WEB的系統(tǒng)開發(fā). 服務(wù)項(xiàng)目涵蓋了網(wǎng)頁設(shè)計(jì)、網(wǎng)站程序開發(fā)、WEB系統(tǒng)開發(fā)、微信二次開發(fā)、移動網(wǎng)站建設(shè)等網(wǎng)站方面業(yè)務(wù)。
import htmllib, urllib, formatter, sys
def parse(url, formatter):
f = urllib.urlopen(url)
data = f.read()
f.close()
p = htmllib.HTMLParser(formatter)
p.feed(data)
p.close()
fmt = formatter.AbstractFormatter(formatter.DumbWriter(sys.stdout))
parse("index.htm", fmt)