本篇內(nèi)容介紹了“HanLP分詞器的用法”的有關(guān)知識(shí),在實(shí)際案例的操作過(guò)程中,不少人都會(huì)遇到這樣的困境,接下來(lái)就讓小編帶領(lǐng)大家學(xué)習(xí)一下如何處理這些情況吧!希望大家仔細(xì)閱讀,能夠?qū)W有所成!
我們提供的服務(wù)有:成都做網(wǎng)站、網(wǎng)站制作、微信公眾號(hào)開(kāi)發(fā)、網(wǎng)站優(yōu)化、網(wǎng)站認(rèn)證、東豐ssl等。為近千家企事業(yè)單位解決了網(wǎng)站和推廣的問(wèn)題。提供周到的售前咨詢(xún)和貼心的售后服務(wù),是有科學(xué)管理、有技術(shù)的東豐網(wǎng)站制作公司
前言:分析關(guān)鍵詞
如何在一段文本之中提取出相應(yīng)的關(guān)鍵詞呢?
之前我有想過(guò)用機(jī)器學(xué)習(xí)的方法來(lái)進(jìn)行詞法分析,但是在項(xiàng)目中測(cè)試時(shí)正確率不夠。于是這時(shí)候便有了 HanLP-漢語(yǔ)言處理包 來(lái)進(jìn)行提取關(guān)鍵詞的想法。
下載:.jar .properties data等文件
這里提供官網(wǎng)下載地址 HanLP下載,1.3.3數(shù)據(jù)包下載
在intellij中配置環(huán)境,并運(yùn)行第一個(gè)demo
在項(xiàng)目中配置jar包,添加依賴(lài)。
file->Project Structure->Modules->Dependencies->+Jars
將properties文件轉(zhuǎn)移到src根目錄下,修改root為自己的數(shù)據(jù)集路徑
字符類(lèi)型對(duì)應(yīng)表加載失?。篋:/BaiduYunDownload/data-for-1.3.3/data/dictionary/other/CharType.dat.yes
解決辦法:查看錯(cuò)誤提示頁(yè)面下是否有該文件,如果沒(méi)有則去網(wǎng)上下載一個(gè)。像我這里,由于只是使用其一部分功能,為了方便就不再下載了,這里我直接修改了一個(gè)文件的文件名—–成功運(yùn)行!。
成功運(yùn)行
---------------------
“HanLP分詞器的用法”的內(nèi)容就介紹到這里了,感謝大家的閱讀。如果想了解更多行業(yè)相關(guān)的知識(shí)可以關(guān)注創(chuàng)新互聯(lián)網(wǎng)站,小編將為大家輸出更多高質(zhì)量的實(shí)用文章!