本篇內(nèi)容介紹了“利用Python爬取豆瓣讀書(shū)頁(yè)面源碼分享”的有關(guān)知識(shí),在實(shí)際案例的操作過(guò)程中,不少人都會(huì)遇到這樣的困境,接下來(lái)就讓小編帶領(lǐng)大家學(xué)習(xí)一下如何處理這些情況吧!希望大家仔細(xì)閱讀,能夠?qū)W有所成!
創(chuàng)新互聯(lián)建站是一家專注于成都做網(wǎng)站、成都網(wǎng)站制作與策劃設(shè)計(jì),同江網(wǎng)站建設(shè)哪家好?創(chuàng)新互聯(lián)建站做網(wǎng)站,專注于網(wǎng)站建設(shè)10余年,網(wǎng)設(shè)計(jì)領(lǐng)域的專業(yè)建站公司;建站業(yè)務(wù)涵蓋:同江等地區(qū)。同江做網(wǎng)站價(jià)格咨詢:13518219792
源代碼如下:
#coding:utf-8from selenium import webdriverclass DouBan:
def __init__(self):
self.dr = webdriver.Chrome() #指定selenium進(jìn)行自動(dòng)化操作時(shí)選用谷歌瀏覽器
self.dr.get('https://book.douban.com/tag/%E5%B0%8F%E8%AF%B4/') #要打開(kāi)的網(wǎng)頁(yè)
def print_content(self):
total_book = self.dr.find_element_by_id('wrapper') #先定位到包含所有圖書(shū)的div盒子中
books = total_book.find_elements_by_class_name('info') #找到已經(jīng)定位到的div盒子里的每一個(gè)包含圖書(shū)介紹的子div
i = 1
for book in books: #通過(guò)for循環(huán)依次把每一本圖書(shū)的內(nèi)容取出來(lái)
print (str(i)+ book.text + '
') #將爬取到的內(nèi)容打印
i += 1
def quit(self):
self.dr.quit() #爬取數(shù)據(jù)完成后關(guān)閉瀏覽器
DouBan().print_content()
“利用Python爬取豆瓣讀書(shū)頁(yè)面源碼分享”的內(nèi)容就介紹到這里了,感謝大家的閱讀。如果想了解更多行業(yè)相關(guān)的知識(shí)可以關(guān)注創(chuàng)新互聯(lián)網(wǎng)站,小編將為大家輸出更多高質(zhì)量的實(shí)用文章!