本篇內(nèi)容介紹了“EKS如何應(yīng)對突發(fā)流量”的有關(guān)知識,在實(shí)際案例的操作過程中,不少人都會遇到這樣的困境,接下來就讓小編帶領(lǐng)大家學(xué)習(xí)一下如何處理這些情況吧!希望大家仔細(xì)閱讀,能夠?qū)W有所成!
公司主營業(yè)務(wù):做網(wǎng)站、成都網(wǎng)站建設(shè)、移動網(wǎng)站開發(fā)等業(yè)務(wù)。幫助企業(yè)客戶真正實(shí)現(xiàn)互聯(lián)網(wǎng)宣傳,提高企業(yè)的競爭能力。創(chuàng)新互聯(lián)建站是一支青春激揚(yáng)、勤奮敬業(yè)、活力青春激揚(yáng)、勤奮敬業(yè)、活力澎湃、和諧高效的團(tuán)隊(duì)。公司秉承以“開放、自由、嚴(yán)謹(jǐn)、自律”為核心的企業(yè)文化,感謝他們對我們的高要求,感謝他們從不同領(lǐng)域給我們帶來的挑戰(zhàn),讓我們激情的團(tuán)隊(duì)有機(jī)會用頭腦與智慧不斷的給客戶帶來驚喜。創(chuàng)新互聯(lián)建站推出華龍免費(fèi)做網(wǎng)站回饋大家。
混合云是一種部署形態(tài),一方面企業(yè)可從資產(chǎn)利舊、成本控制、控制風(fēng)險(xiǎn)減少鎖定等角度選擇混合云。另一方面企業(yè)也可以通過混合業(yè)務(wù)部署獲得不同云服務(wù)商的相對優(yōu)勢能力,以及讓不同云服務(wù)商的能力差異形成互補(bǔ)。 而容器和混合云是天作之合,基于容器標(biāo)準(zhǔn)化封裝,大大降低了應(yīng)用運(yùn)行環(huán)境與混合云異構(gòu)基礎(chǔ)設(shè)施的耦合性,企業(yè)更易于實(shí)現(xiàn)多云/混合云敏捷開發(fā)和持續(xù)交付,使應(yīng)用多地域標(biāo)準(zhǔn)管理化成為可能。 TKE 容器團(tuán)隊(duì)提供了一系列的產(chǎn)品能力來滿足混合云場景,本文介紹其中針對突發(fā)流量場景的產(chǎn)品特性——第三方集群彈 EKS。
IDC 的資源是有限的,當(dāng)有業(yè)務(wù)突發(fā)流量需要應(yīng)對時(shí),IDC 內(nèi)的算力資源可能不足以應(yīng)對。選擇使用公有云資源應(yīng)對臨時(shí)流量是不錯(cuò)的選擇,常見的部署架構(gòu)為:在公有云新建一個(gè)集群,將部分工作負(fù)載部署到云上,通過 DNS 規(guī)則或負(fù)載均衡策略將流量路由到不同的集群:
此種模式下,業(yè)務(wù)的部署架構(gòu)發(fā)生了變化,因此在使用前需要充分評估:
哪些業(yè)務(wù)工作負(fù)載需要在云上部署,是全部還是部分;
云上部署的業(yè)務(wù)是否有環(huán)境依賴,例如 IDC 內(nèi)網(wǎng) DNS、DB、公共服務(wù)等;
云上、云下業(yè)務(wù)日志、監(jiān)控?cái)?shù)據(jù)如何統(tǒng)一展示;
云上、云下業(yè)務(wù)流量調(diào)度規(guī)則;
CD 工具如何適配多集群業(yè)務(wù)部署;
這樣的改造投入對于需要長期維持多地域接入的業(yè)務(wù)場景來說是值得的,但對于突發(fā)流量業(yè)務(wù)場景來說成本較高。因此我們針對這種場景推出了便捷在單集群內(nèi)利用公有云資源應(yīng)對突發(fā)業(yè)務(wù)流量的能力:第三方集群彈 EKS,EKS是騰訊云彈性容器服務(wù),可以秒級創(chuàng)建和銷毀大量 POD 資源,用戶僅需提出 POD 資源需求即可,無需維護(hù)集群節(jié)點(diǎn)可用性,對于彈性的場景來說是非常合適的。僅需要在集群中安裝相關(guān)插件包即可快速獲得擴(kuò)容到 EKS 的能力。
與直接使用云上虛擬機(jī)節(jié)點(diǎn)相比,此種方式擴(kuò)縮容更快,并且我們還提供了2種調(diào)度機(jī)制來滿足客戶的調(diào)度優(yōu)先級需求:
全局開關(guān):在集群層面,當(dāng)集群資源不足時(shí),任何需要新創(chuàng)建Pod的工作負(fù)載都可以將副本創(chuàng)建到騰訊云 EKS 上;
局部開關(guān):在工作負(fù)載層面,用戶可指定單個(gè)工作負(fù)載在本集群保留N個(gè)副本后,其他副本在騰訊云 EKS 中創(chuàng)建;
為了確保所有工作負(fù)載在本地 IDC 均有足夠的副本數(shù),當(dāng)突發(fā)流量過去,觸發(fā)縮容時(shí),支持優(yōu)先縮容騰訊云上 EKS 副本(需要使用 TKE 發(fā)行版集群,關(guān)于 TKE 發(fā)行版的詳細(xì)介紹,請期待后續(xù)發(fā)布的該系列文章)。
這種模式下,業(yè)務(wù)部署架構(gòu)沒有發(fā)生變化,在單集群中即可彈性使用云上資源,避免了引入業(yè)務(wù)架構(gòu)改造、CD流水線改造、多集群管理、監(jiān)控日志統(tǒng)等一系列衍生問題,并且云上資源的使用是按需使用,按需計(jì)費(fèi),大大降低了用戶使用成本。但為了保障工作負(fù)載的安全性和穩(wěn)定性,我們要求用戶的 IDC 與騰訊云公有云 VPC 專線互通,并且用戶也需要從存儲依賴、延時(shí)容忍度等多方面評估適用性。
EKS pod 可與 underlay 網(wǎng)絡(luò)模式的本地集群 pod、node 互通(需要在騰訊云VPC中添加本地pod cidr的路由,參考路由配置),第三方集群彈 EKS 已在 TKEStack中開源,詳細(xì)使用方式和示例見 使用文檔
git clone https://github.com/tkestack/charts.git
編輯 charts/incubator/tke-resilience/values.yaml,填寫以下信息:
cloud: appID: "{騰訊云賬號APPID}" ownerUIN: "{騰訊云用戶賬號ID}" secretID: "{騰訊云賬號secretID}" secretKey: "{騰訊云賬號secretKey}" vpcID: "{EKS POD放置的VPC ID}" regionShort: {EKS POD 放置的region簡稱} regionLong: {EKS POD 放置的region全稱} subnets: - id: "{EKS POD 放置的子網(wǎng)ID}" zone: "{EKS POD 放置的可用區(qū)}" eklet: podUsedApiserver: {當(dāng)前集群的API Server地址}
helm install tke-resilience --namespace kube-system ./charts/incubator/tke-resilience/
確認(rèn) chart pod 工作正常
由于此特性默認(rèn)已開啟,我們先將kube-system 中 的 AUTO_SCALE_EKS 設(shè)置為 false 默認(rèn)情況下,ngx1 副本數(shù)為1 將ngx1副本數(shù)調(diào)整為50
可以看到有大量 POD 因?yàn)橘Y源不足,處于 pending 狀態(tài) 將 kube-system 中 的 AUTO_SCALE_EKS 設(shè)置為 true 后,短暫等待后,觀察pod狀態(tài),原本處于 pend的pod,被調(diào)度到了 EKS 虛擬節(jié)點(diǎn):eklet-subnet-167kzflm 上。
我們再次將 ngx1 的副本數(shù)調(diào)整為1 編輯 ngx1 yaml,設(shè)置開啟局部開關(guān)
spec: template: metadata: annotations: # 打開局部開關(guān) AUTO_SCALE_EKS: "true" # 設(shè)置需要在本地集群創(chuàng)建的副本個(gè)數(shù) LOCAL_REPLICAS: "2"" spec: # 使用tke調(diào)度器 schedulerName: tke-scheduler
將 ngx1 副本數(shù)改為3,盡管本地集群沒有出現(xiàn)資源不足,但可以看到,超過2個(gè)本地副本后,第三個(gè)副本被調(diào)度到了EKS上
卸載 tke-resilience 插件
helm uninstall tke-resilience -n=kube-system
此外 TKEStack 已集成 tke-resilience,用戶可以在 TKEStack 的應(yīng)用市場中界面化安裝 tke-resilience
電商促銷、直播等需要在短時(shí)間擴(kuò)容大量臨時(shí)工作負(fù)載的場景,這種場景下,資源需求時(shí)間非常短,為了應(yīng)對這種短周期需求而在日常儲備大量資源,勢必會有比較大的資源浪費(fèi),且資源需求量隨每次活動變化難以準(zhǔn)確評估。使用此功能,您無需關(guān)注于資源籌備,僅需依靠K8S的自動伸縮功能,即可快速為業(yè)務(wù)創(chuàng)建出大量工作負(fù)載為業(yè)務(wù)保駕護(hù)航,流量峰值過去后,云上POD會可優(yōu)先銷毀,確保無資源浪費(fèi)的情況。
大數(shù)據(jù)、AI業(yè)務(wù)場景下,計(jì)算任務(wù)對算力亦有高彈性要求。為保障任務(wù)快速計(jì)算完成,需要在短時(shí)間能有大量算力支撐,而計(jì)算完成后,算力同樣處于低負(fù)載狀態(tài),計(jì)算資源利用率呈高波動型,形成了資源浪費(fèi)。并且由于GPU資源的稀缺性,用戶自己囤積大量GPU設(shè)備不僅成本非常高,還會面臨資源利用率提升,新卡適配,老卡利舊,異構(gòu)計(jì)算等多種資源管理問題,而云上豐富的GPU卡型可為用戶提供更多樣的選擇,即用即還的特性也確保了資源零浪費(fèi),每一分錢都真正化在真實(shí)的業(yè)務(wù)需求上。
“EKS如何應(yīng)對突發(fā)流量”的內(nèi)容就介紹到這里了,感謝大家的閱讀。如果想了解更多行業(yè)相關(guān)的知識可以關(guān)注創(chuàng)新互聯(lián)網(wǎng)站,小編將為大家輸出更多高質(zhì)量的實(shí)用文章!