小編給大家分享一下Java機(jī)器學(xué)習(xí)工具和庫有哪些,希望大家閱讀完這篇文章之后都有所收獲,下面讓我們一起去探討吧!
網(wǎng)站建設(shè)哪家好,找創(chuàng)新互聯(lián)!專注于網(wǎng)頁設(shè)計(jì)、網(wǎng)站建設(shè)、微信開發(fā)、微信小程序開發(fā)、集團(tuán)企業(yè)網(wǎng)站建設(shè)等服務(wù)項(xiàng)目。為回饋新老客戶創(chuàng)新互聯(lián)還提供了玉泉街道免費(fèi)建站歡迎大家使用!
1. Weka集成了數(shù)據(jù)挖掘工作的機(jī)器學(xué)習(xí)算法。這些算法可以直接應(yīng)用于一個(gè)數(shù)據(jù)集上或者你可以自己編寫代碼來調(diào)用。Weka包括一系列的工具,如數(shù)據(jù)預(yù)處理、分類、回歸、聚類、關(guān)聯(lián)規(guī)則以及可視化。
2.Massive Online Analysis(MOA)是一個(gè)面向數(shù)據(jù)流挖掘的流行開源框架,有著非?;钴S的成長社區(qū)。它包括一系列的機(jī)器學(xué)習(xí)算法(分類、回歸、聚類、異常檢測、概念漂移檢測和推薦系統(tǒng))和評(píng)估工具。關(guān)聯(lián)了WEKA項(xiàng)目,MOA也是用Java編寫的,其擴(kuò)展性更強(qiáng)。
3.MEKA項(xiàng)目提供了一個(gè)面向多標(biāo)簽學(xué)習(xí)和評(píng)價(jià)方法的開源實(shí)現(xiàn)。在多標(biāo)簽分類中,我們要預(yù)測每個(gè)輸入實(shí)例的多個(gè)輸出變量。這與“普通”情況下只涉及一個(gè)單一目標(biāo)變量的情形不同。此外,MEKA基于WEKA的機(jī)器學(xué)習(xí)工具包。
4. Advanced Data mining And Machine learning System(ADAMS)是一種新型的柔性工作流引擎,旨在迅速建立并保持真實(shí)世界的復(fù)雜知識(shí)流,它是基于GPLv3發(fā)行的。
5. Environment for Developing KDD-Applications Supported by Index-Structure(ELKI)是一款基于Java的開源(AGPLv3)數(shù)據(jù)挖掘軟件。ELKI主要集中于算法研究,重點(diǎn)研究聚類分析中的無監(jiān)督方法和異常檢測。
6. Mallet是一個(gè)基于Java的面向文本文件的機(jī)器學(xué)習(xí)工具包。Mallet支持分類算法,如***熵、樸素貝葉斯和決策樹分類。
7. Encog是一個(gè)先進(jìn)的機(jī)器學(xué)習(xí)框架,集成了支持向量機(jī)(SVM)、人工神經(jīng)網(wǎng)絡(luò)、遺傳算法、貝葉斯網(wǎng)絡(luò)、隱馬爾可夫模型(HMM)、遺傳編程和遺傳算法。
8. Datumbox機(jī)器學(xué)習(xí)框架是一個(gè)用Java編寫的開源框架,允許快速地開發(fā)機(jī)器學(xué)習(xí)和統(tǒng)計(jì)應(yīng)用。該框架的核心重點(diǎn)包括大量的機(jī)器學(xué)習(xí)算法以及統(tǒng)計(jì)測試,能夠處理中等規(guī)模的數(shù)據(jù)集。
9. Deeplearning4j是使用Java和Scala編寫的***個(gè)商業(yè)級(jí)的、開源的、分布式深入學(xué)習(xí)庫。其設(shè)計(jì)的目的是用于商業(yè)環(huán)境中,而不是作為一個(gè)研究工具。
10. Mahout是一個(gè)內(nèi)置算法的機(jī)器學(xué)習(xí)框架。Mahout-Samsara幫助人們創(chuàng)建他們自己的數(shù)學(xué),并提供了一些現(xiàn)成的算法實(shí)現(xiàn)。
11.Rapid Miner是德國多特蒙特技術(shù)大學(xué)開發(fā)的。它為開發(fā)者開發(fā)應(yīng)用程序提供了一個(gè)GUI(圖形用戶界面)和Java API。它還提供了一些機(jī)器學(xué)習(xí)算法,用來做數(shù)據(jù)處理、可視化以及建模。
12. Apache SAMOA是 一個(gè)機(jī)器學(xué)習(xí)(ML)框架,內(nèi)嵌面向分布式流ML算法的編程抽象,并且允許在沒有直接處理底層分布式流處理引擎(DSPEe,如 Apache Storm、Apache S4和Apache samza)復(fù)雜性的情況下,開發(fā)新的ML算法。用戶可以開發(fā)分布式流ML算法,而且可以 在多個(gè)DSPEs上執(zhí)行。
13. Neuroph通過提供支持創(chuàng)建、訓(xùn)練和保存神經(jīng)網(wǎng)絡(luò)的Java網(wǎng)絡(luò)庫和GUI工具,簡化了神經(jīng)網(wǎng)絡(luò)開發(fā)。
14. Oryx 2是一個(gè)建立在Apache Spark和Apache Kafka的Lambda架構(gòu)實(shí)現(xiàn),但隨著實(shí)時(shí)大規(guī)模機(jī)器學(xué)習(xí)而逐漸開始專業(yè)化。這是一個(gè)用于構(gòu)建應(yīng)用程序的框架,但也包括打包,以及面向協(xié)同過濾、分類、回歸和聚類的端到端的應(yīng)用程序。
15. Stanford Classifier是一個(gè)機(jī)器學(xué)習(xí)工具,它可以將數(shù)據(jù)項(xiàng)歸置到一個(gè)類別。一個(gè)概率分類器,比如這個(gè),它可以對(duì)一個(gè)數(shù)據(jù)項(xiàng)給出類分配的概率分布。該軟件是***熵分類器的一個(gè)Java實(shí)現(xiàn)。
16.io是一個(gè)Retina API,有著快速精確的類似大腦的自然語言處理算法。
17.JSAT是一個(gè)快速入門的機(jī)器學(xué)習(xí)庫。該庫是我在業(yè)余時(shí)間開發(fā)的,基于GPL3發(fā)行的。庫中的一部分內(nèi)容可自主學(xué)習(xí),例如所有的代碼都是獨(dú)立的。JSAT沒有外部依賴,而且是純Java編寫的。
18. N-Dimensional Arrays for Java(ND4J)是一個(gè)用于JVM的科學(xué)計(jì)算庫。它們是用來在生產(chǎn)環(huán)境中使用的,這表明例程的設(shè)計(jì)是以最小的內(nèi)存需求來運(yùn)行的。
19. Java Machine Learning Library(Java機(jī)器學(xué)習(xí)庫)是一系列機(jī)器學(xué)習(xí)算法的相關(guān)實(shí)現(xiàn)。這些算法,無論是源代碼還是文檔,都編寫的很出色。其主要語言是Java。
20. Java-ML是一個(gè)使用Java編寫的一系列機(jī)器學(xué)習(xí)算法的Java API。它只提供了一個(gè)標(biāo)準(zhǔn)的算法接口。
21. MLlib (Spark)是Apache Spark的可擴(kuò)展機(jī)器學(xué)習(xí)庫。雖然是Java,但該庫與平臺(tái)還支持Java,Scala和Python綁定。此庫是***的,并且算法很多。
22. H2O是用于智能應(yīng)用的機(jī)器學(xué)習(xí)API。它在大數(shù)據(jù)上對(duì)統(tǒng)計(jì)學(xué)、機(jī)器學(xué)習(xí)和數(shù)學(xué)進(jìn)行了規(guī)?;?。H2O可擴(kuò)展,開發(fā)者可以在核心部分使用簡單的數(shù)學(xué)知識(shí)。
23. WalnutiQ是人腦部分面向?qū)ο竽P?,有著理論常用的學(xué)習(xí)算法(正在向簡單強(qiáng)烈的情感人工智能模型方向研究)。
24. RankLib是一個(gè)排名學(xué)習(xí)算法庫。目前已經(jīng)實(shí)現(xiàn)八種流行的算法。
25. htm.java(基于Java的Hierarchical Temporal Memory算法實(shí)現(xiàn))是一個(gè)面向智能計(jì)算的Numenta平臺(tái)的Java接口。源碼
看完了這篇文章,相信你對(duì)“Java機(jī)器學(xué)習(xí)工具和庫有哪些”有了一定的了解,如果想了解更多相關(guān)知識(shí),歡迎關(guān)注創(chuàng)新互聯(lián)行業(yè)資訊頻道,感謝各位的閱讀!