今天就跟大家聊聊有關在TKE中如何利用 HPA 實現(xiàn)業(yè)務的彈性伸縮,可能很多人都不太了解,為了讓大家更加了解,小編給大家總結了以下內(nèi)容,希望大家根據(jù)這篇文章可以有所收獲。
創(chuàng)新互聯(lián)一直在為企業(yè)提供服務,多年的磨煉,使我們在創(chuàng)意設計,全網(wǎng)營銷推廣到技術研發(fā)擁有了開發(fā)經(jīng)驗。我們擅長傾聽企業(yè)需求,挖掘用戶對產(chǎn)品需求服務價值,為企業(yè)制作有用的創(chuàng)意設計體驗。核心團隊擁有超過十年以上行業(yè)經(jīng)驗,涵蓋創(chuàng)意,策化,開發(fā)等專業(yè)領域,公司涉及領域有基礎互聯(lián)網(wǎng)服務達州電信機房、app軟件定制開發(fā)、手機移動建站、網(wǎng)頁設計、網(wǎng)絡整合營銷。
Kubernetes Pod 水平自動擴縮(Horizontal Pod Autoscaler,以下簡稱 HPA)可以基于 CPU 利用率、內(nèi)存利用率和其他自定義的度量指標自動擴縮 Pod 的副本數(shù)量,以使得工作負載服務的整體度量水平與用戶所設定的目標值匹配。本文將介紹和使用騰訊云容器服務 TKE 的 HPA 功能實現(xiàn) Pod 自動水平擴縮容。
HPA 自動伸縮特性使容器服務具有非常靈活的自適應能力,能夠在用戶設定內(nèi)快速擴容多個 Pod 副本來應對業(yè)務負載的急劇飆升,也可以在業(yè)務負載變小的情況下根據(jù)實際情況適當縮容來節(jié)省計算資源給其他的服務,整個過程自動化無須人為干預,非常適合服務波動較大,服務數(shù)量多且需要頻繁擴縮容的業(yè)務場景,如:電商服務、線上教育、金融服務等。
Pod 水平自動擴縮特性由 Kubernetes API 資源和控制器實現(xiàn)。資源利用指標決定控制器的行為, 控制器會周期性的根據(jù) Pod 資源利用情況調(diào)整服務 Pod 的副本數(shù)量,以使得工作負載的度量水平與用戶所設定的目標值匹配。其擴縮容流程和說明如下:
提示:目前這一功能處于 beta 版本,且 Pod 自動水平擴縮不適用于無法擴縮的對象,比如 DaemonSet 資源。
HPA Controller:控制 HPA 擴縮邏輯的控制組件。
Metrics Aggregator:度量指標聚合器。通常情況下,控制器將從一系列的聚合 API(metrics.k8s.io
、custom.metrics.k8s.io
和 external.metrics.k8s.io
)中獲取度量值。 metrics.k8s.io
API 通常由 Metrics 服務器提供,社區(qū)版可提供基本的 CPU、內(nèi)存度量類型,相比于社區(qū)版,TKE 使用自定義 Metrics Server 采集可支持更廣泛的的 HPA 的度量指標觸發(fā)類型,提供包括 CPU 、內(nèi)存、硬盤、網(wǎng)絡和 GPU 相關指標,了解更多詳細內(nèi)容參閱 TKE 自動伸縮指標說明。
提示:控制器也可以直接從 Heapster 獲取指標。但自 Kubernetes 1.11 起,從 Heapster 獲取指標特性的方式已廢棄。
HPA 計算目標副本數(shù)算法:TKE HPA 擴縮容算法請參考 工作原理,更多詳細算法請參閱 算法細節(jié)。
已 注冊騰訊云賬戶。
已登錄 騰訊云容器服務控制臺。
已創(chuàng)建 TKE 集群。關于創(chuàng)建集群,詳情請參見 創(chuàng)建集群。
第 1 步:部署測試工作負載
以 Deployment 資源類型的工作負載為例,創(chuàng)建一個單副本數(shù),服務類型為 WEB 服務的 "hpa-test" 工作負載,在 TKE 控制臺創(chuàng)建Deployment 類型工作負載方法請參閱 Deployment 管理。本示例創(chuàng)建結果如下圖所示:
第 2 步:配置 HPA
在 TKE 控制臺為測試工作負載綁定一個 HPA 配置,關于如何綁定配置 HPA 請參閱 HPA 操作步驟 ,本示例配置當網(wǎng)絡出帶寬達到0.15Mbps(150Kbps) 時觸發(fā)擴容的策略。
第 3 步:功能驗證
在集群中啟動一個臨時 Pod 對配置的 HPA 功能進行測試(模擬客戶端):
kubectl run -it --image alpine hpa-test --restart=Never --rm /bin/sh
在臨時 Pod 中運行下面命令短時間內(nèi)模擬大量請求訪問 "hpa-test" 服務使出口流量帶寬增大:
# hpa-test.default.svc.cluster.local 為服務在集群中的域名,當需要停止腳本時按 Ctrl+C 即可 while true; do wget -q -O - hpa-test.default.svc.cluster.local; done
在測試 Pod 中執(zhí)行模擬請求命令后,通過觀察下圖中工作負載的 Pod 數(shù)量監(jiān)控可以看到,在 16:21 分時工作負載擴容副本數(shù)量至 2 個,由此可推斷出已經(jīng)觸發(fā)了 HPA 的擴容事件。
再通過下圖的工作負載的網(wǎng)絡出口帶寬監(jiān)控可以看出在 16:21 右左時網(wǎng)絡出口帶寬增至大概 199 Kbps,已經(jīng)超過 HPA 設定的網(wǎng)絡出口帶寬目標值,進一步證明此時觸發(fā) HPA 擴縮容算法 擴容了一個副本數(shù)來滿足設定的目標值,故工作負載的副本數(shù)量變成了 2 個。
注意:HPA 擴縮容算法 不只以公式計算維度去控制擴縮容邏輯,而會多維度去衡量是否需要擴容或縮容,詳情可以參閱 算法細節(jié),所以在實際情況中可能和預期會稍有偏差。
接下來模擬縮容過程,在 16:24 左右手動停止執(zhí)行模擬請求的命令, 從下圖監(jiān)控看到此時網(wǎng)絡出口帶寬值下降到擴容前位置,按照 HPA 的邏輯,此時已經(jīng)滿足工作負載縮容的條件。
但從下圖工作負載的 Pod 數(shù)量監(jiān)控可以看出,工作負載在 16:30 分時才觸發(fā)了 HPA 的縮容,這是因為觸發(fā)了 HPA 縮容有默認 5 分鐘的容忍時間的算法,以防止度量指標短時間波動導致的頻繁的擴縮容,詳情請參閱 冷卻/延遲支持。從下圖可以看出工作負載副本數(shù)在停止命令 5 分鐘后按照 HPA 擴縮容算法 縮容到了最初設定的 1 個副本數(shù)。
當 TKE 發(fā)生 HPA 擴縮容事件時,會在對應的 HPA 實例的事件列表展示,如下圖所示。需要注意的是事件通知列表的時間分為 “首次出現(xiàn)時間” 和 “最后出現(xiàn)時間”,“首次出現(xiàn)時間” 表示相同事件第一次出現(xiàn)的時間,”最后出現(xiàn)時間” 為相同事件出現(xiàn)的最新時間,所以從下圖事件列表 “最后出現(xiàn)時間” 字段可以看到本示例擴容事件時間點是16:21:03,縮容事件時間是16.29:42,時間點與工作負載監(jiān)控看到的時間點相吻合。
此外,工作負載事件列表也會記錄 HPA 發(fā)生時工作負載的增刪副本數(shù)事件,從下圖可以看出工作負載擴縮容時間點與 HPA 事件列表的時間點也是吻合的,增加副本數(shù)時間點是 16:21:03,減少副本數(shù)時間點是 16: 29:42。
在本示例中主要演示了 TKE 的 HPA 功能, 使用 TKE 自定義的網(wǎng)絡出口帶寬度量類型作為工作負載 HPA 的擴縮容度量指標,當工作負載實際度量值超過 HPA 配置的度量目標值時, HPA 根據(jù)擴容算法計算出合適的副本數(shù)實現(xiàn)水平擴容,保證工作負載的度量指標滿足預期,保障工作負載健康穩(wěn)定運行;當實際度量值遠低于 HPA 配置的度量目標值時,HPA 會在容忍時間后計算合適的副本數(shù)實現(xiàn)水平縮容,適當釋放閑置資源,達到提升資源利用率的目的,并且整個過程在 HPA 和工作負載事件列表都會有相應的事件記錄,使整個工作負載水平擴縮容全程可追溯。
看完上述內(nèi)容,你們對在TKE中如何利用 HPA 實現(xiàn)業(yè)務的彈性伸縮有進一步的了解嗎?如果還想了解更多知識或者相關內(nèi)容,請關注創(chuàng)新互聯(lián)行業(yè)資訊頻道,感謝大家的支持。