創(chuàng)新互聯(lián)www.cdcxhl.cn八線動態(tài)BGP香港云服務(wù)器提供商,新人活動買多久送多久,劃算不套路!
成都創(chuàng)新互聯(lián)一直秉承“誠信做人,踏實做事”的原則,不欺瞞客戶,是我們最起碼的底線! 以服務(wù)為基礎(chǔ),以質(zhì)量求生存,以技術(shù)求發(fā)展,成交一個客戶多一個朋友!為您提供成都網(wǎng)站設(shè)計、網(wǎng)站建設(shè)、成都網(wǎng)頁設(shè)計、微信小程序開發(fā)、成都網(wǎng)站開發(fā)、成都網(wǎng)站制作、成都軟件開發(fā)、App定制開發(fā)是成都本地專業(yè)的網(wǎng)站建設(shè)和網(wǎng)站設(shè)計公司,等你一起來見證!小編給大家分享一下運用jieba庫的方法,希望大家閱讀完這篇文章后大所收獲,下面讓我們一起去探討吧!
《斗破蒼穹》可謂玄幻小說的巔峰之作,曾經(jīng)癡迷到徹夜看小說,回不到的過去,等不到的未來!今天就利用python的jieba庫以及在線制作詞云工具TAGUL,制作《斗破蒼穹》詞云。
步驟
jieba分詞
首先,通過pip3 install jieba安裝jieba庫,隨后在網(wǎng)上下載《斗破蒼穹》小說及停用詞表。代碼如下:
import jieba.analyse path = '小說路徑' fp = open(path,'r',encoding='utf-8') content = fp.read() try: jieba.analyse.set_stop_words('停用詞表路徑') tags = jieba.analyse.extract_tags(content, topK=100, withWeight=True) for item in tags: print(item[0]+'\t'+str(int(item[1]*1000))) finally: fp.close()
大家運行程序可能會報錯,是編碼問題,我們這時需打開下載的txt文檔,另存為,選擇utf-8編碼即可。
運行部分結(jié)果圖:
詞云制作
(1)打開taglue官網(wǎng),點擊import words,把運行的結(jié)果copy過來。
(2)選擇形狀,在這里是網(wǎng)上下載的圖片進行的導(dǎo)入。
(3)選擇字體。
(4)點擊Visualize生成圖片。
《斗破蒼穹》詞云
在這個斗氣大陸上,只有強者才可以生存,蕭炎在藥老及丹藥的幫助下不斷修煉,擁有多種異火,有著極強的靈魂感知力;在不斷修煉中,遇到了小醫(yī)仙,納蘭,美杜莎,紫研等人,成為斗氣大陸上的強者而奮斗。
看完了這篇文章,相信你對運用jieba庫的方法有了一定的了解,想了解更多相關(guān)知識,歡迎關(guān)注創(chuàng)新互聯(lián)-成都網(wǎng)站建設(shè)公司行業(yè)資訊頻道,感謝各位的閱讀!