前言
創(chuàng)新互聯(lián)專(zhuān)業(yè)做網(wǎng)站、成都網(wǎng)站制作,集網(wǎng)站策劃、網(wǎng)站設(shè)計(jì)、網(wǎng)站制作于一體,網(wǎng)站seo、網(wǎng)站優(yōu)化、網(wǎng)站營(yíng)銷(xiāo)、軟文發(fā)布平臺(tái)等專(zhuān)業(yè)人才根據(jù)搜索規(guī)律編程設(shè)計(jì),讓網(wǎng)站在運(yùn)行后,在搜索中有好的表現(xiàn),專(zhuān)業(yè)設(shè)計(jì)制作為您帶來(lái)效益的網(wǎng)站!讓網(wǎng)站建設(shè)為您創(chuàng)造效益。要想學(xué)好爬蟲(chóng),必須把基礎(chǔ)打扎實(shí),之前發(fā)布了兩篇文章,分別是使用XPATH和requests爬取網(wǎng)頁(yè),今天的文章是學(xué)習(xí)Beautiful Soup并通過(guò)一個(gè)例子來(lái)實(shí)現(xiàn)如何使用Beautiful Soup爬取網(wǎng)頁(yè)。
什么是Beautiful Soup
Beautiful Soup要和其他的解析器搭配使用,例如Python標(biāo)準(zhǔn)庫(kù)中的HTML解析器和其他第三方的lxml解析器,由于lxml解析器速度快、容錯(cuò)能力強(qiáng),因此一般和Beautiful Soup搭配使用。
初始化Beautiful Soup對(duì)象的代碼:
html = '''Hello Beautiful Soup Hello
''' soup = BeautifulSoup(html,'lxml')