小編給大家分享一下如何向pyhanlp添加自定義的詞典,相信大部分人都還不怎么了解,因此分享這篇文章給大家參考一下,希望大家閱讀完這篇文章后大有收獲,下面讓我們一起去了解一下吧!
創(chuàng)新互聯(lián)公司是專業(yè)的普定網(wǎng)站建設(shè)公司,普定接單;提供網(wǎng)站建設(shè)、成都網(wǎng)站建設(shè),網(wǎng)頁(yè)設(shè)計(jì),網(wǎng)站設(shè)計(jì),建網(wǎng)站,PHP網(wǎng)站建設(shè)等專業(yè)做網(wǎng)站服務(wù);采用PHP框架,可快速的進(jìn)行普定網(wǎng)站開(kāi)發(fā)網(wǎng)頁(yè)制作和功能擴(kuò)展;專業(yè)做搜索引擎喜愛(ài)的網(wǎng)站,專業(yè)的做網(wǎng)站團(tuán)隊(duì),希望更多企業(yè)前來(lái)合作!以python 2.7.9為例:
1.安裝pyhanlp:pip install pyhanlp
2.在字典路徑下添加自定義的詞典:CustomDictionary主詞典文本路徑是data/dictionary/custom/CustomDictionary.txt,用戶可以在此增加自己的詞語(yǔ)(不推薦);也可以單獨(dú)新建一個(gè)文本文件,通過(guò)配置文件;CustomDictionaryPath=data/dictionary/custom/CustomDictionary.txt; 我的詞典.txt;來(lái)追加詞典(推薦)。
具體絕對(duì)路徑可用hanlp --version獲取:
#hanlp --version
jar 1.6.3: /usr/local/lib/python2.7/site-packages/pyhanlp/static/hanlp-1.6.3.jar
data 1.6.2: /usr/local/lib/python2.7/site-packages/pyhanlp/static/data
config : /usr/local/lib/python2.7/site-packages/pyhanlp/static/hanlp.properties
#cat /usr/local/lib/python2.7/site-packages/pyhanlp/static/hanlp.properties | grep "CustomDictionaryPath"
3.建議在該路徑下添加自己的詞典文件例如 我的詞典.txt,并將其加入上面的properties文件里的CustomDictionaryPath下面。
#cat 我的詞典.txt
codis集群 nz 1000
今日頭條 nz 1000
第一列為詞條,第二列為詞性(默認(rèn)為n),第三列為詞頻
4.然后需要?jiǎng)h除緩存文件,這樣python才會(huì)重新加載新增的文件:
#rm -f CustomDictionary.txt.bin
5.測(cè)試新增的詞典:
python -c "from pyhanlp import *;print(HanLP.segment('codis集群,今日頭條'))"
五月 16, 2018 4:43:14 下午 com.hankcs.hanlp.corpus.io.IOUtil readBytes
警告: 讀取/usr/local/lib/python2.7/site-packages/pyhanlp/static/data/dictionary/custom/CustomDictionary.txt.bin時(shí)發(fā)生異常java.io.FileNotFoundException: /usr/local/lib/python2.7/site-packages/pyhanlp/static/data/dictionary/custom/CustomDictionary.txt.bin (沒(méi)有那個(gè)文件或目錄)
報(bào)這個(gè)錯(cuò)誤沒(méi)有關(guān)系,只是個(gè)warning,重新加載緩存文件而已。
以上是“如何向pyhanlp添加自定義的詞典”這篇文章的所有內(nèi)容,感謝各位的閱讀!相信大家都有了一定的了解,希望分享的內(nèi)容對(duì)大家有所幫助,如果還想學(xué)習(xí)更多知識(shí),歡迎關(guān)注創(chuàng)新互聯(lián)-成都網(wǎng)站建設(shè)公司行業(yè)資訊頻道!