本來想通過python調(diào)用Java實(shí)現(xiàn)Hanlp的使用,參考文章:http://t.cn/RUrIF7z
讓客戶滿意是我們工作的目標(biāo),不斷超越客戶的期望值來自于我們對(duì)這個(gè)行業(yè)的熱愛。我們立志把好的技術(shù)通過有效、簡(jiǎn)單的方式提供給客戶,將通過不懈努力成為客戶在信息化領(lǐng)域值得信任、有價(jià)值的長(zhǎng)期合作伙伴,公司提供的服務(wù)項(xiàng)目有:域名申請(qǐng)、雅安服務(wù)器托管、營(yíng)銷軟件、網(wǎng)站建設(shè)、潁上網(wǎng)站維護(hù)、網(wǎng)站推廣。##########python可以用easy_install安裝一些軟件############
1.JPype使用介紹
參考:http://michael-paul.iteye.com/blog/1055786
Python 作為一種靈活的軟件開發(fā)語言在當(dāng)今被廣泛使用。在軟件開發(fā)過程中,有時(shí)需要在 Python 項(xiàng)目中利用既有的 Java 代碼,已達(dá)到節(jié)省時(shí)間和開發(fā)成本的目的。因此,找到一個(gè) Python 代碼調(diào)用 Java 代碼的橋梁是非常有意義的。 JPype 就是這樣的一個(gè)工具,利用它可以使 Python 程序方便的調(diào)用 Java 代碼,從而擴(kuò)充 Python 語言的能力,彌補(bǔ) Python 語言的不足。本文介紹了如何利用 JPype 整合 Python 程序和 Java 程序的一些基本方法。
下面是一個(gè)簡(jiǎn)單的 python 程序,通過 JPype 調(diào)用 Java 的打印函數(shù),打印出字符串。
清單 1. hello world
import jpype
jvmPath = jpype.getDefaultJVMPath()
jpype.startJVM(jvmPath)
jpype.java.lang.System.out.println( “ hello world! ” )
jpype.shutdownJVM()
運(yùn)行該例程的時(shí)候,getDefaultJVMPath()找不到默認(rèn)的jvm路徑,檢查發(fā)現(xiàn)在命令行下輸入java和javac都是沒問題,而且已經(jīng)配置好環(huán)境變量。找到j(luò)pype官方文檔給的例程(http://jpype.sourceforge.net/doc/user-guide/userguide.html),使用說明(http://blog.csdn.net/niuyisheng/article/details/9002926)發(fā)現(xiàn)歷程中jdk中jre文件有client文件夾,而現(xiàn)在版本只有server文件夾,然后找一篇文章介紹jvm中client模式和server模式的區(qū)別(http://ryxxlong.iteye.com/blog/1696537),發(fā)現(xiàn)他們用的都是jdk1.6,而現(xiàn)在的版本是jdk1.8,猜想新版本已經(jīng)沒有該功能了,把jdk換成1.6版本還是發(fā)現(xiàn)沒有client文件夾,放棄在python中調(diào)用java包Hanlp,直接在java程序中使用hanlp。
11大Java開源中文分詞器的使用方法和分詞效果對(duì)比:
http://my.oschina.net/apdplat/blog/412921?fromerr=jF95Yz4r
2.關(guān)于HanLP
HanLP是一個(gè)致力于向生產(chǎn)環(huán)境普及NLP技術(shù)的開源Java工具包,支持:
中文分詞(N-最短路分詞、CRF分詞、索引分詞、用戶自定義詞典、詞性標(biāo)注),
命名實(shí)體識(shí)別(中國(guó)人名、音譯人名、日本人名、地名、實(shí)體機(jī)構(gòu)名識(shí)別),
關(guān)鍵詞提取,自動(dòng)摘要,短語提取,拼音轉(zhuǎn)換,簡(jiǎn)繁轉(zhuǎn)換,文本推薦,依存句法分析(MaxEnt依存句法分析、神經(jīng)網(wǎng)絡(luò)依存句法分析)。
Hanlp的安裝和入門說明:http://hanlp.linrunsoft.com/doc/_build/html/getting_started.html#hanlp
HanLP 中的數(shù)據(jù)分為 詞典 和 模型 ,其中 詞典 是詞法分析必需的, 模型 是句法分析必需的
官網(wǎng)demo:https://github.com/hankcs/HanLP/tree/master/src/test/java/com/hankcs/demo
文章來源于zhangqiang1104的博客