有個(gè)自然語言處理的人工智能網(wǎng)站特別有意思,還能快速生成可視化圖表,推薦給大家:http://ictclas.nlpir.org/nlpir/
如何爬取這個(gè)網(wǎng)站隱藏在背后的數(shù)據(jù)呢?
我這里演示一下聯(lián)想詞數(shù)據(jù)的爬?。?/p>
import requests,json
content=str(input('請(qǐng)輸入要查詢的文本:'))
url='http://ictclas.nlpir.org/nlpir/index6/getWord2Vec.do'
headers={
'Referer': 'http://ictclas.nlpir.org/nlpir/',
'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_14_6) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/76.0.3809.132 Safari/537.36'
}
data={
'content': content
}
res=requests.post(url,headers=headers,data=data)
res_dic=json.loads(res.text)
w2vlist=res_dic['w2vlist']
for i in range(10):
word=w2vlist[i]
print(word)
這個(gè)網(wǎng)站的可視化功能也很強(qiáng)大,一鍵生成美麗圖表~
這是快速生成詞云圖,用python的話比較麻煩一些,好處是可以進(jìn)行個(gè)性化修改。如果沒有太高要求的話,nlpir網(wǎng)站完全可以勝任:
還有很多可視化圖表,小伙伴們可以去嘗試一下:
另外有需要云服務(wù)器可以了解下創(chuàng)新互聯(lián)cdcxhl.cn,海內(nèi)外云服務(wù)器15元起步,三天無理由+7*72小時(shí)售后在線,公司持有idc許可證,提供“云服務(wù)器、裸金屬服務(wù)器、高防服務(wù)器、香港服務(wù)器、美國服務(wù)器、虛擬主機(jī)、免備案服務(wù)器”等云主機(jī)租用服務(wù)以及企業(yè)上云的綜合解決方案,具有“安全穩(wěn)定、簡單易用、服務(wù)可用性高、性價(jià)比高”等特點(diǎn)與優(yōu)勢(shì),專為企業(yè)上云打造定制,能夠滿足用戶豐富、多元化的應(yīng)用場(chǎng)景需求。