小編給大家分享一下運(yùn)用jieba庫(kù)的方法,希望大家閱讀完這篇文章后大所收獲,下面讓我們一起去探討吧!
成都創(chuàng)新互聯(lián)公司服務(wù)項(xiàng)目包括邛崍網(wǎng)站建設(shè)、邛崍網(wǎng)站制作、邛崍網(wǎng)頁(yè)制作以及邛崍網(wǎng)絡(luò)營(yíng)銷策劃等。多年來,我們專注于互聯(lián)網(wǎng)行業(yè),利用自身積累的技術(shù)優(yōu)勢(shì)、行業(yè)經(jīng)驗(yàn)、深度合作伙伴關(guān)系等,向廣大中小型企業(yè)、政府機(jī)構(gòu)等提供互聯(lián)網(wǎng)行業(yè)的解決方案,邛崍網(wǎng)站推廣取得了明顯的社會(huì)效益與經(jīng)濟(jì)效益。目前,我們服務(wù)的客戶以成都為中心已經(jīng)輻射到邛崍省份的部分城市,未來相信會(huì)繼續(xù)擴(kuò)大服務(wù)區(qū)域并繼續(xù)獲得客戶的支持與信任!
《斗破蒼穹》可謂玄幻小說的巔峰之作,曾經(jīng)癡迷到徹夜看小說,回不到的過去,等不到的未來!今天就利用python的jieba庫(kù)以及在線制作詞云工具TAGUL,制作《斗破蒼穹》詞云。
步驟
jieba分詞
首先,通過pip3 install jieba安裝jieba庫(kù),隨后在網(wǎng)上下載《斗破蒼穹》小說及停用詞表。代碼如下:
import jieba.analyse path = '小說路徑' fp = open(path,'r',encoding='utf-8') content = fp.read() try: jieba.analyse.set_stop_words('停用詞表路徑') tags = jieba.analyse.extract_tags(content, topK=100, withWeight=True) for item in tags: print(item[0]+'\t'+str(int(item[1]*1000))) finally: fp.close()
大家運(yùn)行程序可能會(huì)報(bào)錯(cuò),是編碼問題,我們這時(shí)需打開下載的txt文檔,另存為,選擇utf-8編碼即可。
運(yùn)行部分結(jié)果圖:
詞云制作
(1)打開taglue官網(wǎng),點(diǎn)擊import words,把運(yùn)行的結(jié)果copy過來。
(2)選擇形狀,在這里是網(wǎng)上下載的圖片進(jìn)行的導(dǎo)入。
(3)選擇字體。
(4)點(diǎn)擊Visualize生成圖片。
《斗破蒼穹》詞云
在這個(gè)斗氣大陸上,只有強(qiáng)者才可以生存,蕭炎在藥老及丹藥的幫助下不斷修煉,擁有多種異火,有著極強(qiáng)的靈魂感知力;在不斷修煉中,遇到了小醫(yī)仙,納蘭,美杜莎,紫研等人,成為斗氣大陸上的強(qiáng)者而奮斗。
看完了這篇文章,相信你對(duì)運(yùn)用jieba庫(kù)的方法有了一定的了解,想了解更多相關(guān)知識(shí),歡迎關(guān)注創(chuàng)新互聯(lián)行業(yè)資訊頻道,感謝各位的閱讀!