真实的国产乱ⅩXXX66竹夫人,五月香六月婷婷激情综合,亚洲日本VA一区二区三区,亚洲精品一区二区三区麻豆

成都創(chuàng)新互聯(lián)網(wǎng)站制作重慶分公司

python爬蟲爬取球迷評論

python爬蟲爬取球迷評論,很多新手對此不是很清楚,為了幫助大家解決這個難題,下面小編將為大家詳細(xì)講解,有這方面需求的人可以來學(xué)習(xí)下,希望你能有所收獲。

創(chuàng)新互聯(lián)建站于2013年創(chuàng)立,先為寧江等服務(wù)建站,寧江等地企業(yè),進(jìn)行企業(yè)商務(wù)咨詢服務(wù)。為寧江企業(yè)網(wǎng)站制作PC+手機(jī)+微官網(wǎng)三網(wǎng)同步一站式服務(wù)解決您的所有建站問題。

這次用python爬蟲爬點(diǎn)好玩的東西

這兩天看恰好有nba決賽,是球迷的你肯定不會錯過的,更何況今年的西部決賽是火箭對戰(zhàn)勇士,今年的火箭是很強(qiáng)的,因為沒到關(guān)鍵時候總會有人站出來。當(dāng)然,勇士也是挺強(qiáng)的,畢竟不能小看庫里杜蘭特等四大巨頭。

東部的決賽我就不太知道了,一直以為是凱爾特人會苦戰(zhàn)騎士,誰知道缺了兩大主力的凱爾特人還是很強(qiáng),而且還打了騎士2:0,看來這次的騎士會是兇多吉少了,不知道凱爾特人會不會成功復(fù)仇,讓我們拭目以待吧!

有直播就肯定有評論,所以我想爬取下球迷評論,看看他們都在聊什么!

準(zhǔn)備工作

需要用到的庫:

    requests:用于網(wǎng)絡(luò)請求

    jieba:用于分詞

    wordcloud:制作詞云圖

    numpy:制作背景圖片

詞云背景圖片:

python爬蟲爬取球迷評論

上面的庫都是可以直接用pip進(jìn)行下載的,但是wordcloud會報錯,報錯如下:

python爬蟲爬取球迷評論

我們需要去官網(wǎng)下載whl文件進(jìn)行手動安裝

官網(wǎng):https://www.lfd.uci.edu/~gohlke/pythonlibs/

然后找到對應(yīng)自己安裝的python版本進(jìn)行下載

python爬蟲爬取球迷評論

最后在命令行下安裝即可

pip install “文件路徑+whl文件名”

接下來尋找目標(biāo)網(wǎng)頁

文字直播地址:https://www.zhibo8.cc/zhibo/nba/2018/0517123898.htm?redirect=zhibo

在這個網(wǎng)頁通過抓包(按下f12)課知道下面這個鏈接是返回評論信息,而且是個json

python爬蟲爬取球迷評論

python爬蟲爬取球迷評論

鏈接為:https://cache.zhibo8.cc/json/2018/nba/0517123898_384.htm?key=0.6512348313080727

通過多次分析知道上面加粗的是直播間的信息,后面的下劃線之后的是評論的頁數(shù),最后的key參數(shù)是個隨機(jī)數(shù),帶不帶上進(jìn)行請求都沒有關(guān)系

用代碼來獲取評論信息

def __get_json(self, index):
       url = 'https://cache.zhibo8.cc/json/2018/nba/0517123898_%d.htm?key=0.1355540028791382' % index
       response = requests.get(url)
       if response.status_code == 200:
           for item in response.json():
               # 寫入文件
               self.__write_file(item['content'])
               self.num += 1
           return 1
       else:
           return 0

評論信息有了,接著弄張詞云圖

def __get_wordcloud(self):
       with open('comments.txt', 'r', encoding='utf-8') as comments:
           text = comments.read()  # 加載數(shù)據(jù)
           words = ' '.join(jieba.cut(text, cut_all=True))  # 采用結(jié)巴全分詞模式
           image = np.array(Image.open('1.jpg'))  # 背景圖片
           # 初始化詞云
           wc = WordCloud(font_path=r'C:\Windows\Fonts\simkai.ttf',
                          background_color='white', mask=image,
                          max_font_size=100, max_words=2000)
           wc.generate(words)  # 生成詞云
           wc.to_file('img.png')  # 生成圖片
           image_file = Image.open('img.png')  # 打開圖片
           image_file.show()

好了,代碼完成,看下效果:

python爬蟲爬取球迷評論

利用詞云圖一眼就可以看出球迷都在評論什么了,因為我爬取的是火箭主場對戰(zhàn)勇士的第二場比賽,肯定討論最多的就是勇士火箭了,緊接的就是杜蘭特了,死亡之神,這場的杜蘭特超神拿了38分還是輸給了火箭,自然而然就是討論他最多了。還有就是這場站出來的塔克,三分6中5,還破了個人季后賽的最高得分,討論他也是很正常的事。還有一個很顯眼的就是第三節(jié),很多人都認(rèn)為勇士是“勇三瘋”,以為這場比賽勇士會在第三節(jié)爆發(fā)吧?其實這賽季的火箭第三節(jié)也是很強(qiáng)的,并不比勇士弱。

看完上述內(nèi)容是否對您有幫助呢?如果還想對相關(guān)知識有進(jìn)一步的了解或閱讀更多相關(guān)文章,請關(guān)注創(chuàng)新互聯(lián)行業(yè)資訊頻道,感謝您對創(chuàng)新互聯(lián)的支持。


當(dāng)前名稱:python爬蟲爬取球迷評論
網(wǎng)站網(wǎng)址:http://weahome.cn/article/jdcdic.html

其他資訊

在線咨詢

微信咨詢

電話咨詢

028-86922220(工作日)

18980820575(7×24)

提交需求

返回頂部