前言
網(wǎng)站設計制作、成都網(wǎng)站制作,成都做網(wǎng)站公司-創(chuàng)新互聯(lián)已向上1000家企業(yè)提供了,網(wǎng)站設計,網(wǎng)站制作,網(wǎng)絡營銷等服務!設計與技術(shù)結(jié)合,多年網(wǎng)站推廣經(jīng)驗,合理的價格為您打造企業(yè)品質(zhì)網(wǎng)站。
一般來說,現(xiàn)在的互聯(lián)網(wǎng)應用網(wǎng)站或者APP,它的整體流程可以用我們這個圖里展示的來表示,用戶請求開始,從這個界面是最里面的瀏覽器和APP,到網(wǎng)絡轉(zhuǎn)發(fā),再到應用服務,最后到存儲,這純屬可能是數(shù)據(jù)庫文件系統(tǒng),然后再返回到界面呈現(xiàn)內(nèi)容。
隨著互聯(lián)網(wǎng)的普及,內(nèi)容信息越來越復雜,用戶數(shù)和訪問量越來越大,我們的應用需要支撐更多的并發(fā)量,同時,我們的應用服務器和數(shù)據(jù)庫服務器所做的計算也越來越多,但是,往往我們的應用服務器的資源是有限的,而且技術(shù)變革是緩慢的,所以每秒能接收請求次數(shù)也是有限的,或者說文件的讀寫也是有限的。
如何能有效利用有限的資源來提供盡可能大的吞吐量呢?一個有效的辦法就是引入緩存,打破圖中的標準的流程,每個環(huán)節(jié)中請求可以從緩存中直接獲取目標數(shù)據(jù)并返回,從而減少他們的計算量,來有效提升響應速度,讓有限的資源服務更多的用戶,像我們這個圖里展示的緩存的使用,它其實可以出現(xiàn)在1到4的各個環(huán)節(jié)中。
緩存一致性問題
當數(shù)據(jù)時效性要求很高時,需要保證緩存中的數(shù)據(jù)與數(shù)據(jù)庫中的保持一致,而且需要保證緩存節(jié)點和副本中的數(shù)據(jù)也保持一致,不能出現(xiàn)差異現(xiàn)象。
這就比較依賴緩存的過期和更新策略。一般會在數(shù)據(jù)發(fā)生更改的時,主動更新緩存中的數(shù)據(jù)或者移除對應的緩存。
緩存并發(fā)問題
緩存過期后將嘗試從后端數(shù)據(jù)庫獲取數(shù)據(jù),這是一個看似合理的流程。但是,在高并發(fā)場景下,有可能多個請求并發(fā)的去從數(shù)據(jù)庫獲取數(shù)據(jù),對后端數(shù)據(jù)庫造成極大的沖擊,甚至導致 “雪崩”現(xiàn)象。
此外,當某個緩存key在被更新時,同時也可能被大量請求在獲取,這也會導致一致性的問題。那如何避免類似問題呢?
我們會想到類似“鎖”的機制,在緩存更新或者過期的情況下,先嘗試獲取到鎖,當更新或者從數(shù)據(jù)庫獲取完成后再釋放鎖,其他的請求只需要犧牲一定的等待時間,即可直接從緩存中繼續(xù)獲取數(shù)據(jù)。
緩存穿透問題
緩存穿透在有些地方也稱為“擊穿”。很多朋友對緩存穿透的理解是:由于緩存故障或者緩存過期導致大量請求穿透到后端數(shù)據(jù)庫服務器,從而對數(shù)據(jù)庫造成巨大沖擊。
這其實是一種誤解。真正的緩存穿透應該是這樣的:
在高并發(fā)場景下,如果某一個key被高并發(fā)訪問,沒有被命中,出于對容錯性考慮,會嘗試去從后端數(shù)據(jù)庫中獲取,從而導致了大量請求達到數(shù)據(jù)庫,而當該key對應的數(shù)據(jù)本身就是空的情況下,這就導致數(shù)據(jù)庫中并發(fā)的去執(zhí)行了很多不必要的查詢操作,從而導致巨大沖擊和壓力。
可以通過下面的幾種常用方式來避免緩存?zhèn)鹘y(tǒng)問題:
1、緩存空對象
對查詢結(jié)果為空的對象也進行緩存,如果是集合,可以緩存一個空的集合(非null),如果是緩存單個對象,可以通過字段標識來區(qū)分。這樣避免請求穿透到后端數(shù)據(jù)庫。
同時,也需要保證緩存數(shù)據(jù)的時效性。這種方式實現(xiàn)起來成本較低,比較適合命中不高,但可能被頻繁更新的數(shù)據(jù)。
2、單獨過濾處理
對所有可能對應數(shù)據(jù)為空的key進行統(tǒng)一的存放,并在請求前做攔截,這樣避免請求穿透到后端數(shù)據(jù)庫。這種方式實現(xiàn)起來相對復雜,比較適合命中不高,但是更新不頻繁的數(shù)據(jù)。
緩存顛簸問題
緩存的顛簸問題,有些地方可能被成為“緩存抖動”,可以看做是一種比“雪崩”更輕微的故障,但是也會在一段時間內(nèi)對系統(tǒng)造成沖擊和性能影響。一般是由于緩存節(jié)點故障導致。業(yè)內(nèi)推薦的做法是通過一致性Hash算法來解決。
歡迎大家關(guān)注我的公種浩【程序員追風】,文章都會在里面更新,整理的資料也會放在里面。
緩存的雪崩現(xiàn)象
緩存雪崩就是指由于緩存的原因,導致大量請求到達后端數(shù)據(jù)庫,從而導致數(shù)據(jù)庫崩潰,整個系統(tǒng)崩潰,發(fā)生災難。
導致這種現(xiàn)象的原因有很多種,上面提到的“緩存并發(fā)”,“緩存穿透”,“緩存顛簸”等問題,其實都可能會導致緩存雪崩現(xiàn)象發(fā)生。這些問題也可能會被惡意攻ji者所利用。
還有一種情況,例如某個時間點內(nèi),系統(tǒng)預加載的緩存周期性集中失效了,也可能會導致雪崩。為了避免這種周期性失效,可以通過設置不同的過期時間,來錯開緩存過期,從而避免緩存集中失效。
從應用架構(gòu)角度,我們可以通過限流、降級、熔斷等手段來降低影響,也可以通過多級緩存來避免這種災難。
此外,從整個研發(fā)體系流程的角度,應該加強壓力測試,盡量模擬真實場景,盡早的暴露問題從而防范。
緩存無底洞現(xiàn)象
該問題由 facebook 的工作人員提出的, facebook 在 2010 年左右,memcached 節(jié)點就已經(jīng)達3000 個,緩存數(shù)千 G 內(nèi)容。
他們發(fā)現(xiàn)了一個問題---memcached 連接頻率,效率下降了,于是加 memcached 節(jié)點,添加了后,發(fā)現(xiàn)因為連接頻率導致的問題,仍然存在,并沒有好轉(zhuǎn),稱之為”無底洞現(xiàn)象”。
目前主流的數(shù)據(jù)庫、緩存、NOSQL、搜索中間件等技術(shù)棧中,都支持“分片”技術(shù),來滿足“高性能、高并發(fā)、高可用、可擴展”等要求。
有些是在client端通過Hash取模(或一致性Hash)將值映射到不同的實例上,有些是在client端通過范圍取值的方式映射的。當然,也有些是在服務端進行的。
但是,每一次操作都可能需要和不同節(jié)點進行網(wǎng)絡通信來完成,實例節(jié)點越多,則開銷會越大,對性能影響就越大。
主要可以從如下幾個方面避免和優(yōu)化:
1、數(shù)據(jù)分布方式
有些業(yè)務數(shù)據(jù)可能適合Hash分布,而有些業(yè)務適合采用范圍分布,這樣能夠從一定程度避免網(wǎng)絡IO的開銷。
2、IO優(yōu)化
可以充分利用連接池,NIO等技術(shù)來盡可能降低連接開銷,增強并發(fā)連接能力。
3、數(shù)據(jù)訪問方式
一次性獲取大的數(shù)據(jù)集,會比分多次去獲取小數(shù)據(jù)集的網(wǎng)絡IO開銷更小。
當然,緩存無底洞現(xiàn)象并不常見。在絕大多數(shù)的公司里可能根本不會遇到。
最后
歡迎大家一起交流,喜歡文章記得點個贊喲,感謝支持!