這篇文章主要介紹了 spark mlilib中高斯混合聚類的示例分析,具有一定借鑒價(jià)值,感興趣的朋友可以參考下,希望大家閱讀完這篇文章之后大有收獲,下面讓小編帶著大家一起了解一下。
成都創(chuàng)新互聯(lián)公司長(zhǎng)期為上千客戶提供的網(wǎng)站建設(shè)服務(wù),團(tuán)隊(duì)從業(yè)經(jīng)驗(yàn)10年,關(guān)注不同地域、不同群體,并針對(duì)不同對(duì)象提供差異化的產(chǎn)品和服務(wù);打造開放共贏平臺(tái),與合作伙伴共同營(yíng)造健康的互聯(lián)網(wǎng)生態(tài)環(huán)境。為武都企業(yè)提供專業(yè)的網(wǎng)站制作、網(wǎng)站建設(shè),武都網(wǎng)站改版等技術(shù)服務(wù)。擁有十多年豐富建站經(jīng)驗(yàn)和眾多成功案例,為您定制開發(fā)。
package spark.clustering import org.apache.spark.mllib.clustering.{GaussianMixture, KMeans} import org.apache.spark.mllib.linalg.Vectors import org.apache.spark.{SparkConf, SparkContext} /** * 高斯混合聚類 * 高斯分布:當(dāng)一個(gè)數(shù)據(jù)向量在一個(gè)高斯分布的模型計(jì)算與之以內(nèi),則認(rèn)為它與高斯分布相匹配,屬于此模型的聚類. * 混合高斯分布:任何樣本的聚類都可以使用多個(gè)單高斯分布模型來(lái)表示. * * Created by eric on 16-7-21. */ object GMG { val conf = new SparkConf() //創(chuàng)建環(huán)境變量 .setMaster("local") //設(shè)置本地化處理 .setAppName("gaussian") //設(shè)定名稱 val sc = new SparkContext(conf) def main(args: Array[String]) { val data = sc.textFile("./src/main/spark/clustering/gmg.txt") val parsedData = data.map(s => Vectors.dense(s.trim().split(' ').map(_.toDouble))) .cache() val model = new GaussianMixture().setK(2).run(parsedData) // 設(shè)置訓(xùn)練模型的分類數(shù) for (i <- 0 until model.k) { println("weight=%f\nmu=%s\nsigma=\n%s\n" format //逐個(gè)打印單個(gè)模型 (model.weights(i), model.gaussians(i).mu, model.gaussians(i).sigma)) //打印結(jié)果 } } }
1 2 1 2 1 2 2 3 1 4 1 2 2 3 3 2 3 4 3 1 1 1 4 1
感謝你能夠認(rèn)真閱讀完這篇文章,希望小編分享的“ spark mlilib中高斯混合聚類的示例分析”這篇文章對(duì)大家有幫助,同時(shí)也希望大家多多支持創(chuàng)新互聯(lián),關(guān)注創(chuàng)新互聯(lián)行業(yè)資訊頻道,更多相關(guān)知識(shí)等著你來(lái)學(xué)習(xí)!