java高并發(fā)系統(tǒng)設(shè)計之緩存案例?這個問題可能是我們?nèi)粘W(xué)習(xí)或工作經(jīng)常見到的。希望通過這個問題能讓你收獲頗深。下面是小編給大家?guī)淼膮⒖純?nèi)容,讓我們一起來看看吧!
創(chuàng)新互聯(lián)公司服務(wù)項目包括扎魯特旗網(wǎng)站建設(shè)、扎魯特旗網(wǎng)站制作、扎魯特旗網(wǎng)頁制作以及扎魯特旗網(wǎng)絡(luò)營銷策劃等。多年來,我們專注于互聯(lián)網(wǎng)行業(yè),利用自身積累的技術(shù)優(yōu)勢、行業(yè)經(jīng)驗、深度合作伙伴關(guān)系等,向廣大中小型企業(yè)、政府機構(gòu)等提供互聯(lián)網(wǎng)行業(yè)的解決方案,扎魯特旗網(wǎng)站推廣取得了明顯的社會效益與經(jīng)濟效益。目前,我們服務(wù)的客戶以成都為中心已經(jīng)輻射到扎魯特旗省份的部分城市,未來相信會繼續(xù)擴大服務(wù)區(qū)域并繼續(xù)獲得客戶的支持與信任!常見硬件組件的延時情況如下圖:
從這些數(shù)據(jù)中,你可以看到,做一次內(nèi)存尋址大概需要 100ns,而做一次磁盤的查找則需要 10ms??梢?,我們使用內(nèi)存作為緩存的存儲介質(zhì)相比于以磁盤作為主要存儲介質(zhì)的數(shù)據(jù)庫來說,性能上會提高多個數(shù)量級。所以,內(nèi)存是最常見的一種緩存數(shù)據(jù)的介質(zhì)。
Linux 內(nèi)存管理是通過一個叫做 MMU(Memory Management Unit)的硬件,來實現(xiàn)從虛擬地址到物理地址的轉(zhuǎn)換的,但是如果每次轉(zhuǎn)換都要做這么復(fù)雜計算的話,無疑會造成性能的損耗,所以我們會借助一個叫做 TLB(Translation Lookaside Buffer)的組件來緩存最近轉(zhuǎn)換過的虛擬地址,和物理地址的映射。TLB 就是一種緩存組件。
平臺上的短視頻實際上是使用內(nèi)置的網(wǎng)絡(luò)播放器來完成的。網(wǎng)絡(luò)播放器接收的是數(shù)據(jù)流,將數(shù)據(jù)下載下來之后經(jīng)過分離音視頻流,解碼等流程后輸出到外設(shè)設(shè)備上播放。播放器中通常會設(shè)計一些緩存的組件,在未打開視頻時緩存一部分視頻數(shù)據(jù),比如我們打開抖音,服務(wù)端可能一次會返回三個視頻信息,我們在播放第一個視頻的時候,播放器已經(jīng)幫我們緩存了第二、三個視頻的部分數(shù)據(jù),這樣在看第二個視頻的時候就可以給用戶“秒開”的感覺。
當我們第一次請求靜態(tài)的資源時,比如一張圖片,服務(wù)端除了返回圖片信息,在響應(yīng)頭里面還有一個“Etag”的字段。瀏覽器會緩存圖片信息以及這個字段的值。當下一次再請求這個圖片的時候,瀏覽器發(fā)起的請求頭里面會有一個“If-None-Match”的字段,并且把緩存的“Etag”的值寫進去發(fā)給服務(wù)端。服務(wù)端比對圖片信息是否有變化,如果沒有,則返回瀏覽器一個 304 的狀態(tài)碼,瀏覽器會繼續(xù)使用緩存的圖片信息。通過這種緩存協(xié)商的方式,可以減少網(wǎng)絡(luò)傳輸?shù)臄?shù)據(jù)大小,從而提升頁面展示性能。
靜態(tài)緩存在 Web 1.0 時期是非常著名的,它一般通過生成 Velocity 模板或者靜態(tài) HTML 文件來實現(xiàn)靜態(tài)緩存,在 Nginx 上部署靜態(tài)緩存可以減少對于后臺應(yīng)用服務(wù)器的壓力
分布式緩存的大名可謂是如雷貫耳了,我們平時耳熟能詳?shù)?Memcached、Redis 就是分布式緩存的典型例子。它們性能強勁,通過一些分布式的方案組成集群可以突破單機的限制。所以在整體架構(gòu)中,分布式緩存承擔著非常重要的角色
Guava Cache 或者是 Ehcache 等,它們和應(yīng)用程序部署在同一個進程中,優(yōu)勢是不需要跨網(wǎng)絡(luò)調(diào)度,速度極快,所以可以用來阻擋短時間內(nèi)的熱點查詢。
在更新數(shù)據(jù)時不更新緩存,而是刪除緩存中的數(shù)據(jù),在讀取數(shù)據(jù)時,發(fā)現(xiàn)緩存中沒了數(shù)據(jù)之后,再從數(shù)據(jù)庫中讀取數(shù)據(jù),更新到緩存中。
這個策略就是我們使用緩存最常見的策略,Cache Aside 策略(也叫旁路緩存策略),這個策略數(shù)據(jù)以數(shù)據(jù)庫中的數(shù)據(jù)為準,緩存中的數(shù)據(jù)是按需加載的。
Cache Aside 策略是我們?nèi)粘i_發(fā)中最經(jīng)常使用的緩存策略,不過我們在使用時也要學(xué)會依情況而變,并不是一成不變的。Cache Aside 存在的大的問題是當寫入比較頻繁時,緩存中的數(shù)據(jù)會被頻繁地清理,這樣會對緩存的命中率有一些影響。如果你的業(yè)務(wù)對緩存命中率有嚴格的要求,那么可以考慮兩種解決方案:
一種做法是在更新數(shù)據(jù)時也更新緩存,只是在更新緩存前先加一個分布式鎖,因為這樣在同一時間只允許一個線程更新緩存,就不會產(chǎn)生并發(fā)問題了。當然這么做對于寫入的性能會有一些影響(推薦);
另一種做法同樣也是在更新數(shù)據(jù)時更新緩存,只是給緩存加一個較短的過期時間,這樣即使出現(xiàn)緩存不一致的情況,緩存的數(shù)據(jù)也會很快過期,對業(yè)務(wù)的影響也是可以接受。
這個策略的核心原則是用戶只與緩存打交道,由緩存和數(shù)據(jù)庫通信,寫入或者讀取數(shù)據(jù)。
Write Through
的策略是這樣的:先查詢要寫入的數(shù)據(jù)在緩存中是否已經(jīng)存在,如果已經(jīng)存在,則更新緩存中的數(shù)據(jù),并且由緩存組件同步更新到數(shù)據(jù)庫中,如果緩存中數(shù)據(jù)不存在,我們把這種情況叫做“Write Miss(寫失效)”。一般來說,我們可以選擇兩種“Write Miss”方式:一個是“Write Allocate(按寫分配)”,做法是寫入緩存相應(yīng)位置,再由緩存組件同步更新到數(shù)據(jù)庫中;另一個是“No-write allocate(不按寫分配)”,做法是不寫入緩存中,而是直接更新到數(shù)據(jù)庫中。 我們看到 Write Through 策略中寫數(shù)據(jù)庫是同步的,這對于性能來說會有比較大的影響,因為相比于寫緩存,同步寫數(shù)據(jù)庫的延遲就要高很多了。通過Write Back策略異步的更新數(shù)據(jù)庫。
Read Through
策略就簡單一些,它的步驟是這樣的:先查詢緩存中數(shù)據(jù)是否存在,如果存在則直接返回,如果不存在,則由緩存組件負責從數(shù)據(jù)庫中同步加載數(shù)據(jù)。
這個策略的核心思想是在寫入數(shù)據(jù)時只寫入緩存,并且把緩存塊兒標記為“臟”的。而臟塊兒只有被再次使用時才會將其中的數(shù)據(jù)寫入到后端存儲中。 在“Write Miss”的情況下,我們采用的是“Write Allocate”的方式,也就是在寫入后端存儲的同時要寫入緩存,這樣我們在之后的寫請求中都只需要更新緩存即可,而無需更新后端存儲了。注意與上面的write through策略作區(qū)分。
我們在讀取緩存時如果發(fā)現(xiàn)緩存命中則直接返回緩存數(shù)據(jù)。如果緩存不命中則尋找一個可用的緩存塊兒,如果這個緩存塊兒是“臟”的,就把緩存塊兒中之前的數(shù)據(jù)寫入到后端存儲中,并且從后端存儲加載數(shù)據(jù)到緩存塊兒,如果不是臟的,則由緩存組件將后端存儲中的數(shù)據(jù)加載到緩存中,最后我們將緩存設(shè)置為不是臟的,返回數(shù)據(jù)就好了。
write back策略多用于向磁盤中寫數(shù)據(jù)。例如:操作系統(tǒng)層面的 Page Cache、日志的異步刷盤、消息隊列中消息的異步寫入磁盤等。因為這個策略在性能上的優(yōu)勢毋庸置疑,它避免了直接寫磁盤造成的隨機寫問題,畢竟寫內(nèi)存和寫磁盤的隨機 I/O 的延遲相差了幾個數(shù)量級呢。
緩存的命中率是緩存需要監(jiān)控的數(shù)據(jù)指標,緩存的高可用可以一定程度上減少緩存穿透的概率,提升系統(tǒng)的穩(wěn)定性。緩存的高可用方案主要包括客戶端方案、中間代理層方案和服務(wù)端方案三大類:
在客戶端方案中,你需要關(guān)注緩存的寫和讀兩個方面: 寫入數(shù)據(jù)時,需要把被寫入緩存的數(shù)據(jù)分散到多個節(jié)點中,即進行數(shù)據(jù)分片; 讀數(shù)據(jù)時,可以利用多組的緩存來做容錯,提升緩存系統(tǒng)的可用性。關(guān)于讀數(shù)據(jù),這里可以使用主從和多副本兩種策略,兩種策略是為了解決不同的問題而提出的。 具體的實現(xiàn)細節(jié)包括:數(shù)據(jù)分片、主從、多副本
數(shù)據(jù)分片
一致性Hash算法。在這個算法中,我們將整個 Hash 值空間組織成一個虛擬的圓環(huán),然后將緩存節(jié)點的 IP 地址或者主機名做 Hash 取值后,放置在這個圓環(huán)上。當我們需要確定某一個 Key 需要存取到哪個節(jié)點上的時候,先對這個 Key 做同樣的 Hash 取值,確定在環(huán)上的位置,然后按照順時針方向在環(huán)上“行走”,遇到的第一個緩存節(jié)點就是要訪問的節(jié)點。
這時如果在 Node 1 和 Node 2 之間增加一個 Node 5,你可以看到原本命中 Node 2 的 Key 3 現(xiàn)在命中到 Node 5,而其它的 Key 都沒有變化;同樣的道理,如果我們把 Node 3 從集群中移除,那么只會影響到 Key 5 。所以你看,在增加和刪除節(jié)點時,只有少量的 Key 會“漂移”到其它節(jié)點上,而大部分的 Key 命中的節(jié)點還是會保持不變,從而可以保證命中率不會大幅下降。 【提示】一致性hash出現(xiàn)的緩存雪崩現(xiàn)象使用虛擬節(jié)點解決。一致性hash分片與hash分片的區(qū)別在于,緩存命中率的問題,hash分片在存在機器加入或是減少的情況時候,會導(dǎo)致緩存失效,緩存命中率下降。
主從
Redis 本身支持主從的部署方式,但是 Memcached 并不支持,Memcached 的主從機制是如何在客戶端實現(xiàn)的。為每一組 Master 配置一組 Slave,更新數(shù)據(jù)時主從同步更新。讀取時,優(yōu)先從 Slave 中讀數(shù)據(jù),如果讀取不到數(shù)據(jù)就穿透到 Master 讀取,并且將數(shù)據(jù)回種到 Slave 中以保持 Slave 數(shù)據(jù)的熱度。主從機制大的優(yōu)點就是當某一個 Slave 宕機時,還會有 Master 作為兜底,不會有大量請求穿透到數(shù)據(jù)庫的情況發(fā)生,提升了緩存系統(tǒng)的高可用性。
多副本
主從方式已經(jīng)能夠解決大部分場景的問題,但是對于極端流量的場景下,一組 Slave 通常來說并不能完全承擔所有流量,Slave 網(wǎng)卡帶寬可能成為瓶頸。為了解決這個問題,我們考慮在 Master/Slave 之前增加一層副本層,整體架構(gòu)是這樣的:
這個方案中,當客戶端發(fā)起查詢請求時,請求首先會先從多個副本組中選取一個副本組發(fā)起查詢,如果查詢失敗,就繼續(xù)查詢 Master/Slave,并且將查詢的結(jié)果回種到所有副本組中,避免副本組中臟數(shù)據(jù)的存在。基于成本的考慮,每一個副本組容量比 Master 和 Slave 要小,因此它只存儲了更加熱的數(shù)據(jù)。在這套架構(gòu)中,Master 和 Slave 的請求量會大大減少,為了保證它們存儲數(shù)據(jù)的熱度,在實踐中我們會把 Master 和 Slave 作為一組副本組使用。
業(yè)界也有很多中間代理層方案,比如 Facebook 的Mcrouter,Twitter 的Twemproxy,豌豆莢的Codis。它們的原理基本上可以由一張圖來概括:
Redis 在 2.4 版本中提出了 Redis Sentinel 模式來解決主從 Redis 部署時的高可用問題,它可以在主節(jié)點掛了以后自動將從節(jié)點提升為主節(jié)點,保證整體集群的可用性,整體的架構(gòu)如下圖所示:
redis Sentinel 也是集群部署的,這樣可以避免 Sentinel 節(jié)點掛掉造成無法自動故障恢復(fù)的問題,每一個 Sentinel 節(jié)點都是無狀態(tài)的。在 Sentinel 中會配置 Master 的地址,Sentinel 會時刻監(jiān)控 Master 的狀態(tài),當發(fā)現(xiàn) Master 在配置的時間間隔內(nèi)無響應(yīng),就認為 Master 已經(jīng)掛了,Sentinel 會從從節(jié)點中選取一個提升為主節(jié)點,并且把所有其他的從節(jié)點作為新主的從節(jié)點。Sentinel 集群內(nèi)部在仲裁的時候,會根據(jù)配置的值來決定當有幾個 Sentinel 節(jié)點認為主掛掉可以做主從切換的操作,也就是集群內(nèi)部需要對緩存節(jié)點的狀態(tài)達成一致才行。
【提示】上述客戶端到sentinel集群的連線是虛線,因為對于緩存的寫入和讀取請求不會經(jīng)過 Sentinel 節(jié)點。
互聯(lián)網(wǎng)系統(tǒng)的數(shù)據(jù)訪問模型一般會遵從“80/20 原則”?!?0/20 原則”又稱為帕累托法則,是意大利經(jīng)濟學(xué)家帕累托提出的一個經(jīng)濟學(xué)的理論。簡單來說,它是指在一組事物中,最重要的部分通常只占 20%,而其他的 80% 并沒有那么重要。把它應(yīng)用到數(shù)據(jù)訪問的領(lǐng)域,就是我們會經(jīng)常訪問 20% 的熱點數(shù)據(jù),而另外的 80% 的數(shù)據(jù)則不會被經(jīng)常訪問。既然緩存的容量有限,并且大部分的訪問只會請求 20% 的熱點數(shù)據(jù),那么理論上說,我們只需要在有限的緩存空間里存儲 20% 的熱點數(shù)據(jù)就可以有效地保護脆弱的后端系統(tǒng)了,也就可以放棄緩存另外 80% 的非熱點數(shù)據(jù)了。所以這種少量的緩存穿透是不可避免的,但是對系統(tǒng)是沒有損害的。
當我們從數(shù)據(jù)庫中查詢到空值或者發(fā)生異常時,我們可以向緩存中回種一個空值。但是因為空值并不是準確的業(yè)務(wù)數(shù)據(jù),并且會占用緩存的空間,所以我們會給這個空值加一個比較短的過期時間,讓空值在短時間之內(nèi)能夠快速過期淘汰?;胤N空值雖然能夠阻擋大量穿透的請求,但如果有大量的空值緩存,也就會浪費緩存的存儲空間,如果緩存空間被占滿了,還會剔除掉一些已經(jīng)被緩存的用戶信息反而會造成緩存命中率的下降。所以這個方案,我建議你在使用的時候應(yīng)該評估一下緩存容量是否能夠支撐。如果需要大量的緩存節(jié)點來支持,那么就無法通過通過回種空值的方式來解決,這時你可以考慮使用布隆過濾器。
1970 年布隆提出了一種布隆過濾器的算法,用來判斷一個元素是否在一個集合中。這種算法由一個二進制數(shù)組和一個 Hash 算法組成。它的基本思路如下:我們把集合中的每一個值按照提供的 Hash 算法算出對應(yīng)的 Hash 值,然后將 Hash 值對數(shù)組長度取模后得到需要計入數(shù)組的索引值,并且將數(shù)組這個位置的值從 0 改成 1。在判斷一個元素是否存在于這個集合中時,你只需要將這個元素按照相同的算法計算出索引值,如果這個位置的值為 1 就認為這個元素在集合中,否則則認為不在集合中。
如何使用布隆過濾器解決緩存穿透呢?
以存儲用戶信息的表為例進行講解。首先我們初始化一個很大的數(shù)組,比方說長度為 20 億的數(shù)組,接下來我們選擇一個 Hash 算法,然后我們將目前現(xiàn)有的所有用戶的 ID 計算出 Hash 值并且映射到這個大數(shù)組中,映射位置的值設(shè)置為 1,其它值設(shè)置為 0。新注冊的用戶除了需要寫入到數(shù)據(jù)庫中之外,它也需要依照同樣的算法更新布隆過濾器的數(shù)組中相應(yīng)位置的值。那么當我們需要查詢某一個用戶的信息時,先查詢這個 ID 在布隆過濾器中是否存在,如果不存在就直接返回空值,而不需要繼續(xù)查詢數(shù)據(jù)庫和緩存,這樣就可以極大地減少異常查詢帶來的緩存穿透。
布隆過濾器優(yōu)點:
(1)性能高。無論是寫入操作還是讀取操作,時間復(fù)雜度都是 O(1) 是常量值
(2)節(jié)省空間。比如,20 億的數(shù)組需要 2000000000/8/1024/1024 = 238M 的空間,而如果使用數(shù)組來存儲,假設(shè)每個用戶 ID 占用 4 個字節(jié)的空間,那么存儲 20 億用戶需要 2000000000 * 4 / 1024 / 1024 = 7600M 的空間,是布隆過濾器的 32 倍。
布隆過濾器缺點:
(1)它在判斷元素是否在集合中時是有一定錯誤幾率的,比如它會把不是集合中的元素判斷為處在集合中。
原因:Hash算法本身的缺陷。
解決方案:使用多個 Hash 算法為元素計算出多個 Hash 值,只有所有 Hash 值對應(yīng)的數(shù)組中的值都為 1 時,才會認為這個元素在集合中。
(2)不支持刪除元素。布隆過濾器不支持刪除元素的缺陷也和 Hash 碰撞有關(guān)。舉一個例子,假如兩個元素 A 和 B 都是集合中的元素,它們有相同的 Hash 值,它們就會映射到數(shù)組的同一個位置。這時我們刪除了 A,數(shù)組中對應(yīng)位置的值也從 1 變成 0,那么在判斷 B 的時候發(fā)現(xiàn)值是 0,也會判斷 B 是不在集合中的元素,就會得到錯誤的結(jié)論。
解決方案:我會讓數(shù)組中不再只有 0 和 1 兩個值,而是存儲一個計數(shù)。比如如果 A 和 B 同時命中了一個數(shù)組的索引,那么這個位置的值就是 2,如果 A 被刪除了就把這個值從 2 改為 1。這個方案中的數(shù)組不再存儲 bit 位,而是存儲數(shù)值,也就會增加空間的消耗。
比方說當有一個極熱點的緩存項,它一旦失效會有大量請求穿透到數(shù)據(jù)庫,這會對數(shù)據(jù)庫造成瞬時極大的壓力,我們把這個場景叫做“dog-pile effect”(狗樁效應(yīng))。解決狗樁效應(yīng)的思路是盡量地減少緩存穿透后的并發(fā),方案也比較簡單:
(1)在代碼中控制在某一個熱點緩存項失效之后啟動一個后臺線程,穿透到數(shù)據(jù)庫,將數(shù)據(jù)加載到緩存中,在緩存未加載之前,所有訪問這個緩存的請求都不再穿透而直接返回。
(2)通過在 Memcached 或者 Redis 中設(shè)置分布式鎖,只有獲取到鎖的請求才能夠穿透到數(shù)據(jù)庫
在我們的系統(tǒng)中存在著大量的靜態(tài)資源請求:對于移動 APP 來說,這些靜態(tài)資源主要是圖片、視頻和流媒體信息;對于 Web 網(wǎng)站來說,則包括了 JavaScript 文件、CSS 文件、靜態(tài) HTML 文件等等。它們的讀請求量極大并且對訪問速度的要求很高還占據(jù)了很高的帶寬,這時會出現(xiàn)訪問速度慢帶寬被占滿影響動態(tài)請求的問題,那么你就需要考慮如何針對這些靜態(tài)資源進行讀加速了。
靜態(tài)資源訪問的關(guān)鍵點是就近訪問,即北京用戶訪問北京的數(shù)據(jù),杭州用戶訪問杭州的數(shù)據(jù),這樣才可以達到性能的最優(yōu)。我們考慮在業(yè)務(wù)服務(wù)器的上層增加一層特殊的緩存,用來承擔絕大部分對于靜態(tài)資源的訪問,這一層特殊緩存的節(jié)點需要遍布在全國各地,這樣可以讓用戶選擇最近的節(jié)點訪問。緩存的命中率也需要一定的保證,盡量減少訪問資源存儲源站的請求數(shù)量(回源請求)。這一層緩存就是CDN。
CDN(Content Delivery Network/Content Distribution Network,內(nèi)容分發(fā)網(wǎng)絡(luò))。簡單來說,CDN 就是將靜態(tài)的資源分發(fā)到位于多個地理位置機房中的服務(wù)器上,因此它能很好地解決數(shù)據(jù)就近訪問的問題,也就加快了靜態(tài)資源的訪問速度。
搭建一個 CDN 系統(tǒng)需要考慮哪兩點:
(1)如何將用戶的請求映射到 CDN 節(jié)點上
你可能會覺得這很簡單啊,只需要告訴用戶 CDN 節(jié)點的 IP 地址,然后請求這個 IP 地址上面部署的 CDN 服務(wù)就可以了啊。但是,并不是這樣,需要把ip替換為相應(yīng)的域名。那么如何做到這一點呢?這就需要依靠 DNS 來幫我們解決域名映射的問題了。DNS(Domain Name System,域名系統(tǒng))實際上就是一個存儲域名和 IP 地址對應(yīng)關(guān)系的分布式數(shù)據(jù)庫。而域名解析的結(jié)果一般有兩種,一種叫做“A 記錄”,返回的是域名對應(yīng)的 IP 地址;另一種是“CNAME 記錄”,返回的是另一個域名,也就是說當前域名的解析要跳轉(zhuǎn)到另一個域名的解析上。
舉個例子:比如你的公司的一級域名叫做 example.com,那么你可以把你的圖片服務(wù)的域名定義為“img.example.com”,然后將這個域名的解析結(jié)果的 CNAME 配置到 CDN 提供的域名上,比如 uclound 可能會提供一個域名是“80f21f91.cdn.ucloud.com.cn”這個域名。這樣你的電商系統(tǒng)使用的圖片地址可以是“img.example.com/1.jpg”。
用戶在請求這個地址時,DNS 服務(wù)器會將域名解析到 80f21f91.cdn.ucloud.com.cn 域名上,然后再將這個域名解析為 CDN 的節(jié)點 IP,這樣就可以得到 CDN 上面的資源數(shù)據(jù)了。
域名層級解析優(yōu)化
因為域名解析過程是分級的,每一級有專門的域名服務(wù)器承擔解析的職責,所以域名的解析過程有可能需要跨越公網(wǎng)做多次 DNS 查詢,在性能上是比較差的。一個解決的思路是:在 APP 啟動時對需要解析的域名做預(yù)先解析,然后把解析的結(jié)果緩存到本地的一個 LRU 緩存里面。這樣當我們要使用這個域名的時候,只需要從緩存中直接拿到所需要的 IP 地址就好了,如果緩存中不存在才會走整個 DNS 查詢的過程。同時為了避免 DNS 解析結(jié)果的變更造成緩存內(nèi)數(shù)據(jù)失效,我們可以啟動一個定時器定期地更新緩存中的數(shù)據(jù)。
(2)如何根據(jù)用戶的地理位置信息選擇到比較近的節(jié)點。
GSLB(Global Server Load Balance,全局負載均衡)的含義是對于部署在不同地域的服務(wù)器之間做負載均衡,下面可能管理了很多的本地負載均衡組件。它有兩方面的作用:一方面,它是一種負載均衡服務(wù)器,負載均衡,顧名思義嘛,指的是讓流量平均分配使得下面管理的服務(wù)器的負載更平均;另一方面,它還需要保證流量流經(jīng)的服務(wù)器與流量源頭在地緣上是比較接近的。
GSLB 可以通過多種策略來保證返回的 CDN 節(jié)點和用戶盡量保證在同一地緣區(qū)域,比如說可以將用戶的 IP 地址按照地理位置劃分為若干個區(qū)域,然后將 CDN 節(jié)點對應(yīng)到一個區(qū)域上,根據(jù)用戶所在區(qū)域來返回合適的節(jié)點;也可以通過發(fā)送數(shù)據(jù)包測量 RTT 的方式來決定返回哪一個節(jié)點。
總結(jié):DNS 技術(shù)是 CDN 實現(xiàn)中使用的核心技術(shù),可以將用戶的請求映射到 CDN 節(jié)點上;DNS 解析結(jié)果需要做本地緩存,降低 DNS 解析過程的響應(yīng)時間;GSLB 可以給用戶返回一個離著他更近的節(jié)點,加快靜態(tài)資源的訪問速度。
(1)百度域名的解析過程
一開始,域名解析請求先會檢查本機的 hosts 文件,查看是否有 www.baidu.com 對應(yīng)的 IP;如果沒有的話,就請求 Local DNS 是否有域名解析結(jié)果的緩存,如果有就返回標識是從非權(quán)威 DNS 返回的結(jié)果;如果沒有就開始 DNS 的迭代查詢。先請求根 DNS,根 DNS 返回頂級 DNS(.com)的地址;再請求.com 頂級 DNS 得到 baidu.com 的域名服務(wù)器地址;再從 baidu.com 的域名服務(wù)器中查詢到 www.baidu.com 對應(yīng)的 IP 地址,返回這個 IP 地址的同時標記這個結(jié)果是來自于權(quán)威 DNS 的結(jié)果,同時寫入 Local DNS 的解析結(jié)果緩存,這樣下一次的解析同一個域名就不需要做 DNS 的迭代查詢了。
(2)CDN延時
一般我們會通過 CDN 廠商的接口將靜態(tài)的資源寫入到某一個 CDN 節(jié)點上,再由 CDN 內(nèi)部的同步機制將資源分散同步到每個 CDN 節(jié)點,即使 CDN 內(nèi)部網(wǎng)絡(luò)經(jīng)過了優(yōu)化,這個同步的過程是有延時的,一旦我們無法從選定的 CDN 節(jié)點上獲取到數(shù)據(jù),我們就不得不從源站獲取數(shù)據(jù),而用戶網(wǎng)絡(luò)到源站的網(wǎng)絡(luò)可能會跨越多個主干網(wǎng),這樣不僅性能上有損耗也會消耗源站的帶寬,帶來更高的研發(fā)成本。所以我們在使用 CDN 的時候需要關(guān)注 CDN 的命中率和源站的帶寬情況。
感謝各位的閱讀!看完上述內(nèi)容,你們對java高并發(fā)系統(tǒng)設(shè)計之緩存案例大概了解了嗎?希望文章內(nèi)容對大家有所幫助。如果想了解更多相關(guān)文章內(nèi)容,歡迎關(guān)注創(chuàng)新互聯(lián)-成都網(wǎng)站建設(shè)公司行業(yè)資訊頻道。