這篇文章主要介紹“怎么在CSharp中調(diào)用HanLP”,在日常操作中,相信很多人在怎么在CSharp中調(diào)用HanLP問題上存在疑惑,小編查閱了各式資料,整理出簡單好用的操作方法,希望對(duì)大家解答”怎么在CSharp中調(diào)用HanLP”的疑惑有所幫助!接下來,請(qǐng)跟著小編一起來學(xué)習(xí)吧!
創(chuàng)新互聯(lián)公司專注于企業(yè)成都營銷網(wǎng)站建設(shè)、網(wǎng)站重做改版、鐵東網(wǎng)站定制設(shè)計(jì)、自適應(yīng)品牌網(wǎng)站建設(shè)、H5場景定制、購物商城網(wǎng)站建設(shè)、集團(tuán)公司官網(wǎng)建設(shè)、成都外貿(mào)網(wǎng)站建設(shè)公司、高端網(wǎng)站制作、響應(yīng)式網(wǎng)頁設(shè)計(jì)等建站業(yè)務(wù),價(jià)格優(yōu)惠性價(jià)比高,為鐵東等各大城市提供網(wǎng)站開發(fā)制作服務(wù)。
IKVM.NET是一款開源的Java虛擬機(jī),可以將hanlp.jar類庫轉(zhuǎn)為dll直接供C#程序調(diào)用,也可以直接當(dāng)JVM讓hanlp.jar運(yùn)行在.NET平臺(tái)上。請(qǐng)自行下載 IKVM ,本文使用的是ikvm-7.2.4630.5。
HanLP 是一個(gè)致力于向生產(chǎn)環(huán)境普及NLP技術(shù)的開源Java工具包,支持中文分詞(N-最短路分詞、CRF分詞、索引分詞、用戶自定義詞典、詞性標(biāo)注),命名實(shí)體識(shí)別(中國人名、音譯人名、日本人名、地名、實(shí)體機(jī)構(gòu)名識(shí)別),關(guān)鍵詞提取,自動(dòng)摘要,短語提取,拼音轉(zhuǎn)換,簡繁轉(zhuǎn)換,文本推薦,依存句法分析(MaxEnt依存句法分析、神經(jīng)網(wǎng)絡(luò)依存句法分析)。
HanLP由3部分組成:類庫hanlp.jar包、模型data包、配置文件hanlp.properties,請(qǐng)前往項(xiàng)目主頁下載最新版: https://github.com/hankcs/HanLP/releases
下載后,你需要編輯配置文件第一行的root指向data的父目錄, 詳見文檔 。
Native JVM情況下,我們是這樣調(diào)用hanlp.jar的,新建一個(gè)目錄(假定為C:\hanlp),把hanlp.jar和hanlp.properties放進(jìn)去:
然后cd到這個(gè)目錄內(nèi),一句命令行:
java -cp .;hanlp-1.2.7.jar com.hankcs.hanlp.summary.TextRankSentence
就能運(yùn)行成功了:
[無限算法的產(chǎn)生是由于未能確定的定義終止條件, 這類算法在有限的時(shí)間內(nèi)終止, 有限的非確定算法]
這里通過-cp選項(xiàng)指定了classpath為當(dāng)前目錄,這樣 HanLP 就能找到hanlp.properties了。
另外,在新版HanLP中,移除了所有的main方法,所以可能會(huì)報(bào)找不到main方法的異常。新版用戶不必糾結(jié)于命令行調(diào)用,直接寫代碼調(diào)用即可。
使用IKVM的話,只要將java換成ikvm即可:
C:\ikvm-7.2.4630.5\bin\ikvm -cp .;hanlp-1.2.7.jar com.hankcs.hanlp.summary.TextRankSentence
效果是一樣的:
CSharp是不能直接調(diào)用jar包的,需要轉(zhuǎn)為dll。IKVM提供了一個(gè)轉(zhuǎn)換工具ikvmc,使用方法如下:
C:\hanlp>C:\ikvm-7.2.4630.5\bin\ikvmc -target:library C:\hanlp\hanlp-1.2.7.jar
ikvmc會(huì)輸出消息:
IKVM.NET Compiler version 7.2.4630.5Copyright (C) 2002-2012 Jeroen Frijtershttp://www.ikvm.net/ note IKVMC0002: Output file is "hanlp-1.2.7.dll"
同時(shí)會(huì)在C:\hanlp目錄下生成hanlp-1.2.7.dll。
首先新建一個(gè)CSharp項(xiàng)目:
然后引用剛才生成的hanlp.dll和ikvm-7.2.4630.5\bin目錄下的IKVM.OpenJDK.Core.dll這兩個(gè)dll:
確定后就能在解決方案資源管理器中看到這兩個(gè)dll了:
雙擊hanlp還能進(jìn)入到類視圖:
那么就可以愉快地寫代碼調(diào)用 HanLP 了:
using System;using System.Collections.Generic;using System.Linq;using System.Text;using System.Threading.Tasks;using com.hankcs.hanlp; namespace HanLPSharp{ class Program { static void Main(string[] args) { java.lang.System.getProperties().setProperty("java.class.path", "C:\\hanlp"); Console.WriteLine(HanLP.segment("你好,歡迎在CSharp中調(diào)用HanLP的API!")); Console.ReadKey(); } }}
解釋一下,
java.lang.System.getProperties().setProperty("java.class.path", "C:\\hanlp");
這句的作用是設(shè)置classpath到hanlp.properties所在的目錄,請(qǐng)根據(jù)情況自由調(diào)整。
編譯運(yùn)行,效果如下:
這說明HanLP在CSharp中工作良好。
請(qǐng)參考HanLP的項(xiàng)目主頁: https://github.com/hankcs/HanLP
http://stackoverflow.com/questions/3466698/where-does-ikvm-get-its-classpath-from
http://www.ikvm.net/uses.html
到此,關(guān)于“怎么在CSharp中調(diào)用HanLP”的學(xué)習(xí)就結(jié)束了,希望能夠解決大家的疑惑。理論與實(shí)踐的搭配能更好的幫助大家學(xué)習(xí),快去試試吧!若想繼續(xù)學(xué)習(xí)更多相關(guān)知識(shí),請(qǐng)繼續(xù)關(guān)注創(chuàng)新互聯(lián)網(wǎng)站,小編會(huì)繼續(xù)努力為大家?guī)砀鄬?shí)用的文章!