這篇文章主要為大家展示了python代碼如何實現(xiàn)k-means聚類分析,內容簡而易懂,希望大家可以學習一下,學習完之后肯定會有收獲的,下面讓小編帶大家一起來看看吧。
創(chuàng)新互聯(lián)建站專注于企業(yè)全網整合營銷推廣、網站重做改版、榮縣網站定制設計、自適應品牌網站建設、H5場景定制、成都做商城網站、集團公司官網建設、成都外貿網站建設公司、高端網站制作、響應式網頁設計等建站業(yè)務,價格優(yōu)惠性價比高,為榮縣等各大城市提供網站開發(fā)制作服務。一、實驗目標
1、使用 K-means 模型進行聚類,嘗試使用不同的類別個數(shù) K,并分析聚類結果。
2、按照 8:2 的比例隨機將數(shù)據(jù)劃分為訓練集和測試集,至少嘗試 3 個不同的 K 值,并畫出不同 K 下 的聚類結果,及不同模型在訓練集和測試集上的損失。對結果進行討論,發(fā)現(xiàn)能解釋數(shù)據(jù)的最好的 K 值。二、算法原理
首先確定k,隨機選擇k個初始點之后所有點根據(jù)距離質點的距離進行聚類分析,離某一個質點a相較于其他質點最近的點分配到a的類中,根據(jù)每一類mean值更新迭代聚類中心,在迭代完成后分別計算訓 練集和測試集的損失函數(shù)SSE_train、SSE_test,畫圖進行分析。
偽代碼如下:
num=10 #k的種類 for k in range(1,num): 隨機選擇k個質點 for i in range(n): #迭代n次 根據(jù)點與質點間的距離對于X_train進行聚類 根據(jù)mean值迭代更新質點 計算SSE_train 計算SSE_test 畫圖
另外有需要云服務器可以了解下創(chuàng)新互聯(lián)scvps.cn,海內外云服務器15元起步,三天無理由+7*72小時售后在線,公司持有idc許可證,提供“云服務器、裸金屬服務器、高防服務器、香港服務器、美國服務器、虛擬主機、免備案服務器”等云主機租用服務以及企業(yè)上云的綜合解決方案,具有“安全穩(wěn)定、簡單易用、服務可用性高、性價比高”等特點與優(yōu)勢,專為企業(yè)上云打造定制,能夠滿足用戶豐富、多元化的應用場景需求。