今天在整理思維導(dǎo)圖的時候突然發(fā)現(xiàn)有個我不知道的探針startupProbe
,于是查了下官方是這樣解釋的:可以定義一個啟動探針,該探針將推遲所有其他探針,直到 Pod 完成啟動為止
??赐赀@句話有蒙圈于是提出了下面這個問題:
我們提供的服務(wù)有:成都網(wǎng)站設(shè)計、做網(wǎng)站、微信公眾號開發(fā)、網(wǎng)站優(yōu)化、網(wǎng)站認(rèn)證、從化ssl等。為1000多家企事業(yè)單位解決了網(wǎng)站和推廣的問題。提供周到的售前咨詢和貼心的售后服務(wù),是有科學(xué)管理、有技術(shù)的從化網(wǎng)站制作公司
startupProbe 啟動探針存在的意義是不是: 如果服務(wù)A啟動需要1分鐘 ,我們存活探針探測的時候設(shè)置的是initialDelaySeconds 10s后開始探測,然后她探測的時候發(fā)現(xiàn)服務(wù)不正常,然后就開始重啟Pod陷入死循環(huán),但是如果意義在這個地方,那我們可以把探測時間調(diào)整大一點(diǎn),failureThreshold 把這個也多設(shè)置幾次就行了啊。 為什么還要單獨(dú)的設(shè)置一個satrtupProbe呢?
經(jīng)過給大佬討論得出如下答案
在繼續(xù)往下看的時候你需要知道這個: startupProbe 和 livenessProbe 最大的區(qū)別就是startupProbe在探測成功之后就不會繼續(xù)探測了,而livenessProbe在pod的生命周期中一直在探測。
如果沒有startupProbe探針的話我們只設(shè)置livenessProbe探針話會存在如下問題: 一個服務(wù)如果前期啟動需要很長時間,那么它后面死亡未被發(fā)現(xiàn)的時間就越長,為什么會這么說呢?假設(shè)我們一個服務(wù)A啟動完成需要2分鐘,那么我們?nèi)缦麻_始定義livenessProbe
livenessProbe:
httpGet:
path: /test
prot: 80
failureThreshold: 1
initialDelay:5
periodSeconds: 5
如果我們這樣定義的話,那pod 5s就會根據(jù)重啟策略進(jìn)行一次重啟,這個時候你會發(fā)現(xiàn)pod一直會陷入死循環(huán),那我們可以按照上面的猜想把配置改成這樣
livenessProbe:
httpGet:
path: /test
prot: 80
failureThreshold: 6
initialDelay:40
periodSeconds: 5
你肯定會說你看這樣不就行了嗎?這樣的話pod就不會陷入死循環(huán)能啟動起來了,確實這樣pod能夠啟動起來了,但是你有沒有考慮過這樣一個問題,當(dāng)我們啟動完成之后,在后期的探測中,你需要6*5=30s才能發(fā)現(xiàn)這個pod不可用,這個時候你的服務(wù)已經(jīng)停止運(yùn)行了30s你才發(fā)現(xiàn),這在生產(chǎn)中有可能是不會被原諒的。
還有就是這邊只是我們假設(shè)一個服務(wù)A需要1分鐘才能起來,但是在實際生產(chǎn)中你如何定義這些值呢???
針對上面這兩個問題引入startupProbe
之后都解決了
livenessProbe:
httpGet:
path: /test
prot: 80
failureThreshold: 1
initialDelay:5
periodSeconds: 5
livenessProbe:
httpGet:
path: /test
prot: 80
failureThreshold: 60
initialDelay:5
periodSeconds: 5
我們這樣設(shè)置之后,由于啟動探針的存在,程序有605s=300s的啟動時間,一旦啟動探針探測成功之后,就會被livenessProbe接管,這樣在運(yùn)行中出問題livenessProbe就能在15=5s內(nèi)發(fā)現(xiàn)。如果啟動探測是3分鐘內(nèi)還沒有探測成功,則接受Pod的重啟策略進(jìn)行重啟。
上面所描訴的就是kubernetes startupProbe的存在意義?
多希望各位大佬指點(diǎn):
email: zsf18163201@163.com
wechat:×××