真实的国产乱ⅩXXX66竹夫人,五月香六月婷婷激情综合,亚洲日本VA一区二区三区,亚洲精品一区二区三区麻豆

成都創(chuàng)新互聯(lián)網站制作重慶分公司

你與解決“緩存污染”只差這篇文章的距離-創(chuàng)新互聯(lián)

什么是緩存污染?

由于緩存的讀取速度比非緩存要快上很多,所以在高性能場景下,系統(tǒng)在讀取數據時,是首先從緩存中查找需要的數據,如果找到了則直接讀取結果,如果找不到的話,則從內存或者硬盤中查找,再將查找到的結果存入緩存,以備下次使用。

創(chuàng)新互聯(lián)是一家專注于成都網站設計、網站制作與策劃設計,零陵網站建設哪家好?創(chuàng)新互聯(lián)做網站,專注于網站建設10余年,網設計領域的專業(yè)建站公司;建站業(yè)務涵蓋:零陵等地區(qū)。零陵做網站價格咨詢:13518219792

實際上,對于一個系統(tǒng)來說,緩存的空間是有限且寶貴的,我們不可能將所有的數據都放入緩存中進行操作,即便可以數據安全性也得不到保證,而且,如果緩存的數據量過大大,其速度也會變得越來越慢。 這個時候就需要考慮緩存的淘汰機制,但是淘汰哪些數據,又保留哪些數據,這是一個問題。如果處理不得當,就會造成“緩存污染”問題。

而緩存污染,是指系統(tǒng)將不常用的數據從內存移到緩存,造成常用數據的擠出,降低了緩存效率的現(xiàn)象。

解決緩存污染的算法

LFU算法

LFU,英文名Least Frequently Used,字面意思就是最不經常使用的淘汰掉算法,是通過數據被訪問的頻率來判斷一個數據的熱點情況。其核心理念是“歷史上這個數據被訪問次數越多,那么將來其被訪問的次數也多”。

LFU中每個數據塊都有一個引用計數器,所有數據塊按照引用數從大到小的排序。

你與解決“緩存污染”只差這篇文章的距離

步驟:

  1. 新數據插入到尾部,并將計數設置為1;

  2. 當隊列中的數據被訪問后,引用計數+1,然后重新排序,保持引用次數從大到小排序;

  3. 當空間不足,需要淘汰數據時,將尾部引用計數最小的數據塊刪除。

分析:由于是根據頻數進行熱點判斷和淘汰,所以先天具備避免偶發(fā)性、周期性批量操作導致臨時非熱點數據大量涌入緩存,擠出熱點數據的問題。 雖然具備這種先天優(yōu)勢,但依舊存在另一種緩存污染問題,即歷史熱點數據污染當前熱點數據,如果系統(tǒng)訪問模式發(fā)生了改變,新的熱點數據需要計數累加超過舊熱點數據,才能將舊熱點數據進行淘汰,造成熱點效應滯后的問題。

復雜度與代價:每次操作都需要進行計數和排序,并且需要維護每個數據塊計數情況,會占用較高的內存與cpu。

一個小思考,根據LFU算法,如何以O(1)時間復雜度實現(xiàn)get和put操作緩存?


LFU-Aging算法

LFU-Aging是基于LFU的改進算法,目的是解決歷史熱點數據對當前熱點數據的污染問題。有些數據在開始時使用次數很多,但以后就不再使用,這類數據將會長時間留在緩存中,所以“除了訪問次數外,還要考慮訪問時間”,這也是LFU-Aging的核心理念。

雖然算法將時間納入了考量范圍,但LFU-Aging并不是直接記錄數據的訪問時間,而是增加了一個大平均引用計數的閾值,然后通過當前平均引用計數來標識時間,換句話說,就是將當前緩存中的平均引用計數值當作當前的生命年代,當這個生命年代超過了預設的閾值,就會將當前所有計數值減半,形成指數衰變的生命年代。

你與解決“緩存污染”只差這篇文章的距離

分析:優(yōu)點是當訪問模式發(fā)生改變的時候,生命年代的指數衰變會使LFU-Aging能夠更快的適用新的數據訪問模式,淘汰舊的熱點數據。

復雜度與代價:在LFU的基礎上又增加平均引用次數判斷和統(tǒng)計處理,對cpu的消耗更高,并且當平均引用次數超過指定閾值(Aging)后,還需要遍歷每一個數據塊的引用計數,進行指數衰變。

Window-LFU算法

Window-LFU顧名思義叫做窗口期LFU,區(qū)別于原義LFU中記錄所有數據的訪問歷史,Window-LFU只記錄過去一段時間內(窗口期)的訪問歷史,相當于給緩存設置了有效期限,過期數據不再緩存。當需要淘汰時,將這個窗口期內的數據按照LFU算法進行淘汰。

分析:由于是維護一段窗口期的記錄,數據量會比較少,所以內存占用和cpu消耗都比LFU要低。并且這段窗口期相當于給緩存設置了有效期,能夠更快的適應新的訪問模式的變化,緩存污染問題基本不嚴重。

復雜度與代價:維護一段時期內的數據訪問記錄,并對其排序。


LRU算法

LRU算法,英文名Least Recently Used,意思是最近最少使用的淘汰算法,根據數據的歷史訪問記錄來進行淘汰數據,核心思想是“如果數據最近被訪問過1次,那么將來被訪問的概率會更高”,類似于就近優(yōu)先原則。

你與解決“緩存污染”只差這篇文章的距離

步驟:

  1. 新數據插入到鏈表頭部;

  2. 每當命中緩存,便將命中的緩存數據移到鏈表頭部;

  3. 當鏈表滿的時候,將鏈表尾部的數據丟棄。

分析:偶發(fā)性的、周期性的批量操作會使臨時數據涌入緩存,擠出熱點數據,導致LRU熱點命中率急劇下降,緩存污染情況比較嚴重。

復雜度與代價:數據結構復雜度較低;每次需要遍歷鏈表,找到命中的數據塊,然后將數據移到頭部。

LRU-K算法

LRU-K是基于LRU算法的優(yōu)化版,其中K代表最近訪問的次數,從某種意義上,LRU可以看作是LRU-1算法,引入K的意義是為了解決上面所提到的緩存污染問題。其核心理念是從“數據最近被訪問過1次”蛻變成“數據最近被訪問過K次,那么將來被訪問的概率會更高”。

LRU-K與LRU區(qū)別是,LRU-K多了一個數據訪問歷史記錄隊列(需要注意的是,訪問歷史記錄隊列并不是緩存隊列,所以是不保存數據本身的,只是保存對數據的訪問記錄,數據此時依舊在原始存儲中),隊列中維護著數據被訪問的次數以及時間戳,只有當這個數據被訪問的次數大于等于K值時,才會從歷史記錄隊列中刪除,然后把數據加入到緩存隊列中去。

你與解決“緩存污染”只差這篇文章的距離

步驟:

  1. 數據第一次被訪問時,加入到歷史訪問記錄隊列中,訪問次數為1,初始化訪問時間戳;

  2. 如果數據訪問次數沒有達到K次,則訪問次數+1,更新時間戳。當隊列滿了時,按照某種規(guī)則(LRU或者FIFO)將歷史記錄淘汰。為了避免歷史數據污染未來數據的問題,還需要加上一個有效期限,對超過有效期的訪問記錄,進行重新計數。(可以使用懶處理,即每次對訪問記錄做處理時,先將記錄中的訪問時間與當前時間進行對比,如果時間間隔超過預設的值,則訪問次數重置為1并更新時間戳,表示重新開始計數)

  3. 當數據訪問計數大于等于K次后,將數據從歷史訪問隊列中刪除,更新數據時間戳,保存到緩存隊列頭部中(緩存隊列時間戳遞減排序,越到尾部距離當前時間越長);

  4. 緩存隊列中數據被再次訪問后,將其移到頭部,并更新時間戳;

  5. 緩存隊列需要淘汰數據時,淘汰緩存隊列中排在末尾的數據,即:淘汰“倒數第K次訪問離現(xiàn)在最久”的數據。

分析:LRU-K降低了“緩存污染”帶來的問題,命中率比LRU要高。實際應用中LRU-2是綜合各種因素后最優(yōu)的選擇,LRU-3或者更大的K值命中率會高,但適應性差,一旦訪問模式發(fā)生變化,需要大量的新數據訪問才能將歷史熱點訪問記錄清除掉。

復雜度與代價:LRU-K隊列是一個優(yōu)先級隊列。由于LRU-K需要記錄那些被訪問過,但還沒有放入緩存的對象,導致內存消耗會很多。

URL-Two queues算法

URL-Two queues算法類似于LRU-2,不同點在于URL-Two queues將LRU-2算法中的訪問歷史隊列(注意這不是緩存數據的)改為一個FIFO緩存隊列,即:URL-Two queues算法有兩個緩存隊列,一個是FIFO隊列(First in First out,先進先出),一個是LRU隊列。

當數據第一次訪問時,URL-Two queues算法將數據緩存在FIFO隊列里面,當數據第二次被訪問時,則將數據從FIFO隊列移到LRU隊列里面,兩個隊列各自按照自己的方法淘汰數據。

你與解決“緩存污染”只差這篇文章的距離

步驟:

  1. 新訪問的數據先插入到FIFO隊列中;

  2. 如果數據在FIFO隊列中一直沒有被再次訪問,則最終按照FIFO規(guī)則淘汰;

  3. 如果數據在FIFO隊列中被再次訪問,則將數據從FIFO刪除,加入到LRU隊列頭部;

  4. 如果數據在LRU隊列再次被訪問,則將數據移到LRU隊列頭部;

  5. LRU隊列淘汰末尾的數據。

分析:URL-Two queues算法和LRU-2算法命中率類似,但是URL-Two queues會減少一次從原始存儲讀取或計算數據的操作。命中率要高于LRU。

復雜度與代價:需要維護兩個隊列,代價是FIFO和LRU代價之和。

五三LRU算法

emmmm...

這個名字其實是我取的,大概是這種算法還沒有被命名?當然,這是一個玩笑話。

我是在mysql底層實現(xiàn)里發(fā)現(xiàn)這個算法的,mysql在處理緩存淘汰時是用的這個方法,有點像URL-Two queues的變體,只是我們只需要維護一個隊列,然后將隊列按照5:3的比例進行分割,5的那部分叫做young區(qū),3的那部分叫做old區(qū)。具體是怎么樣的請先看我把圖畫出來:

你與解決“緩存污染”只差這篇文章的距離

步驟:

  1. 第一次訪問的數據從隊列的3/8處位置插入;

  2. 如果數據再次被訪問,則移動到隊列頭部;

  3. 如果數據沒有被再訪問,會逐步被熱點數據驅逐向下移;

  4. 淘汰尾部數據。

分析:五三LRU算法算作是URL-Two queues算法的變種,原理其實是一樣的,只是把兩個隊列合二為一個隊列進行數據的處理,所以命中率和URL-Two queues算法一樣。

復雜度與代價:維護一個隊列,代價較低,但是內存占用率和URL-Two queues一樣。

Multi Queue算法

Multi Queue算法根據訪問頻率將數據劃分為多個隊列,不同的隊列具有不同的訪問優(yōu)先級,其核心思想是“優(yōu)先緩存訪問次數多的數據”。

Multi Queue算法將緩存劃分為多個LRU隊列,每個隊列對應不同的訪問優(yōu)先級。訪問優(yōu)先級是根據訪問次數計算出來的,例如: Q0,Q1....Qn代表不同的優(yōu)先級隊列,Q-history代表從緩存中淘汰數據,但記錄了數據的索引和引用次數。

你與解決“緩存污染”只差這篇文章的距離

步驟:

  1. 新插入的數據放入Q0;

  2. 每個隊列按照LRU管理數據,再次訪問的數據移動到頭部;

  3. 當數據的訪問次數達到一定次數,需要提升優(yōu)先級時,將數據從當前隊列刪除,加入到高一級隊列的頭部;

  4. 為了防止高優(yōu)先級數據永遠不被淘汰,當數據在指定的時間里訪問沒有被訪問時,需要降低優(yōu)先級,將數據從當前隊列刪除,加入到低一級的隊列頭部;

  5. 需要淘汰數據時,從最低一級隊列開始按照LRU淘汰;每個隊列淘汰數據時,將數據從緩存中刪除,將數據索引加入Q-history頭部;

  6. 如果數據在Q-history中被重新訪問,則重新計算其優(yōu)先級,移到目標隊列的頭部;

  7. Q-history按照LRU淘汰數據的索引。

分析:Multi Queue降低了“緩存污染”帶來的問題,命中率比LRU要高。

復雜度與代價:Multi Queue需要維護多個隊列,且需要維護每個數據的訪問時間,復雜度比LRU高。Multi Queue需要記錄每個數據的訪問時間,需要定時掃描所有隊列,代價比LRU要高。雖然Multi Queue的隊列看起來數量比較多,但由于所有隊列之和受限于緩存容量的大小,因此這里多個隊列長度之和和一個LRU隊列是一樣的,因此隊列掃描性能也相近。

另外有需要云服務器可以了解下創(chuàng)新互聯(lián)scvps.cn,海內外云服務器15元起步,三天無理由+7*72小時售后在線,公司持有idc許可證,提供“云服務器、裸金屬服務器、高防服務器、香港服務器、美國服務器、虛擬主機、免備案服務器”等云主機租用服務以及企業(yè)上云的綜合解決方案,具有“安全穩(wěn)定、簡單易用、服務可用性高、性價比高”等特點與優(yōu)勢,專為企業(yè)上云打造定制,能夠滿足用戶豐富、多元化的應用場景需求。


網站題目:你與解決“緩存污染”只差這篇文章的距離-創(chuàng)新互聯(lián)
分享路徑:http://weahome.cn/article/dhjosc.html

其他資訊

在線咨詢

微信咨詢

電話咨詢

028-86922220(工作日)

18980820575(7×24)

提交需求

返回頂部