一個(gè)老外的有關(guān)Redis的博客文章中提到一個(gè)有趣的事情:它們?cè)跍y(cè)試期間獲得的延遲圖。為了持久化Redis的數(shù)據(jù)到磁盤(例如:RDB持久化),Redis需要調(diào)用fork()系統(tǒng)命令。
成都創(chuàng)新互聯(lián)公司是專業(yè)的吉水網(wǎng)站建設(shè)公司,吉水接單;提供成都做網(wǎng)站、網(wǎng)站制作,網(wǎng)頁設(shè)計(jì),網(wǎng)站設(shè)計(jì),建網(wǎng)站,PHP網(wǎng)站建設(shè)等專業(yè)做網(wǎng)站服務(wù);采用PHP框架,可快速的進(jìn)行吉水網(wǎng)站開發(fā)網(wǎng)頁制作和功能擴(kuò)展;專業(yè)做搜索引擎喜愛的網(wǎng)站,專業(yè)的做網(wǎng)站團(tuán)隊(duì),希望更多企業(yè)前來合作!通常使用物理服務(wù)器和大多數(shù)虛擬機(jī)管理程序進(jìn)行fork是很快的,即使很大的進(jìn)程也是如此。 然而,Xen的fork()速度很慢,因此對(duì)于某些EC2實(shí)例類型(以及其他虛擬服務(wù)器提供程序),每次父進(jìn)程調(diào)用fork()以便進(jìn)行RDB持久化時(shí),可能會(huì)出現(xiàn)嚴(yán)重的延遲峰值。 如下圖所示,清晰的展示了延遲峰值:
您可以想象一下,如果您在fork()的時(shí)候做一個(gè)延遲測(cè)試,那么在父進(jìn)程fork()的時(shí)候,所有請(qǐng)求將延遲一秒(以上圖為例)。 這將產(chǎn)生大量具有高延遲的樣本,并且將影響99%的結(jié)果。
要更改實(shí)例類型,配置,設(shè)置或其他任何內(nèi)容以改善此行為是一個(gè)好主意,并且有些用例即使單個(gè)請(qǐng)求具有過高延遲也是不可接受的。然而很明顯的是,每30分鐘發(fā)生1秒的延遲峰值不是很明顯,因?yàn)檫@與在請(qǐng)求中均勻分布延遲峰值有很大不同。
如果是均勻分布的峰值,如果訪問某個(gè)頁面需要對(duì)Redis服務(wù)器執(zhí)行大量請(qǐng)求,則訪問頁面很可能會(huì)碰到延遲:這會(huì)嚴(yán)重影響服務(wù)質(zhì)量。
然而,如上圖所示,每運(yùn)行30分鐘后1秒的延遲是完全不同的事情。具有良好延遲表現(xiàn)的百分比隨著請(qǐng)求數(shù)量的增加而變得更好,因?yàn)檎?qǐng)求越多,這個(gè)延遲就越不可能在樣本中過度表示出來,反而會(huì)被隱藏。如果您每分鐘只有1個(gè)請(qǐng)求,并且其中一個(gè)請(qǐng)求恰好碰到fork()導(dǎo)致的高延遲,那就會(huì)讓延遲測(cè)試結(jié)果非常難看。
另外:大多數(shù)頁面瀏覽不受影響。 因?yàn)槲ㄒ荒菐讉€(gè)用戶碰到1秒延遲的,是剛好他們的請(qǐng)求和fork()在同一時(shí)間,其他用戶的請(qǐng)求只會(huì)有極低的概率碰到這樣糟糕的事情。 另外請(qǐng)注意,與fork()撞上的頁面訪問(即使由100個(gè)請(qǐng)求組成)也不會(huì)延遲超過一秒,因?yàn)閒ork()完成后請(qǐng)求就會(huì)完成,并不需要等到RDB持久化完成。
只有fork()會(huì)導(dǎo)致延遲毛刺,fork出來的子進(jìn)程在生成RDB文件過程中,并不會(huì)對(duì)系統(tǒng)有很大的影響。除非子進(jìn)程生成RDB文件的過程中(這個(gè)過程使用了操作系統(tǒng)的copy-on-write機(jī)制)有大量的寫入,而且服務(wù)器可用內(nèi)存不多,這時(shí)候可能會(huì)發(fā)生swapping導(dǎo)致出現(xiàn)延遲。
在當(dāng)今最流行的運(yùn)行時(shí)環(huán)境EC2實(shí)例中,fork延遲是Redis用戶最糟糕的體驗(yàn)之一,所以redis作者正著手測(cè)試Redis和EC2:相信很快就會(huì)在Redis官方文檔中有對(duì)EC2進(jìn)行特定優(yōu)化的說明 ,到時(shí)候會(huì)有比在master-slaves中禁用持久性操作更安全的方案。
如果您現(xiàn)在需要EC2 + Redis主機(jī)并且已禁用持久性,則最簡(jiǎn)單的部署方式是禁用Redis實(shí)例的自動(dòng)重啟,并使用Sentinel進(jìn)行故障轉(zhuǎn)移,以便崩潰的主服務(wù)器不會(huì)自動(dòng)返回可用狀態(tài)。 在檢查故障轉(zhuǎn)移成功并且有新的可用的master后,系統(tǒng)管理員可以手動(dòng)重新啟動(dòng)實(shí)例。
需要說明的是,并非所有EC2實(shí)例都是相同的,恰恰相反,各種EC2實(shí)例fork表現(xiàn)差異還很大。如下圖所示,是老外做的一些測(cè)試:
創(chuàng)新互聯(lián)www.cdcxhl.cn,專業(yè)提供香港、美國(guó)云服務(wù)器,動(dòng)態(tài)BGP最優(yōu)骨干路由自動(dòng)選擇,持續(xù)穩(wěn)定高效的網(wǎng)絡(luò)助力業(yè)務(wù)部署。公司持有工信部辦法的idc、isp許可證, 機(jī)房獨(dú)有T級(jí)流量清洗系統(tǒng)配攻擊溯源,準(zhǔn)確進(jìn)行流量調(diào)度,確保服務(wù)器高可用性。佳節(jié)活動(dòng)現(xiàn)已開啟,新人活動(dòng)云服務(wù)器買多久送多久。