深入理解redis的持久化

最近工作之余學(xué)習(xí)了一下redis，這里簡單的理解一下redis持久化；

Redis提供的持久化機制

成都創(chuàng)新互聯(lián)公司服務(wù)項目包括萬榮網(wǎng)站建設(shè)、萬榮網(wǎng)站制作、萬榮網(wǎng)頁制作以及萬榮網(wǎng)絡(luò)營銷策劃等。多年來，我們專注于互聯(lián)網(wǎng)行業(yè)，利用自身積累的技術(shù)優(yōu)勢、行業(yè)經(jīng)驗、深度合作伙伴關(guān)系等，向廣大中小型企業(yè)、政府機構(gòu)等提供互聯(lián)網(wǎng)行業(yè)的解決方案，萬榮網(wǎng)站推廣取得了明顯的社會效益與經(jīng)濟效益。目前，我們服務(wù)的客戶以成都為中心已經(jīng)輻射到萬榮省份的部分城市，未來相信會繼續(xù)擴大服務(wù)區(qū)域并繼續(xù)獲得客戶的支持與信任！

Redis是一種面向“key-value”類型數(shù)據(jù)的分布式NoSql數(shù)據(jù)庫系統(tǒng)，具有高性能、持久存儲、適應(yīng)高并發(fā)應(yīng)用場景等優(yōu)勢。它雖然起步較晚，但發(fā)展卻十分迅速。

一、Redis持久化是如何工作的？

什么是持久化？簡單來講就是將數(shù)據(jù)放到斷電后數(shù)據(jù)不會丟失的設(shè)備中，也就是我們通常理解的硬盤上。

首先我們來看一下數(shù)據(jù)庫在進行寫操作時到底做了哪些事，主要有下面五個過程：

(1)客戶端向服務(wù)端發(fā)送寫操作（數(shù)據(jù)在客戶端的內(nèi)存中）。

(2)數(shù)據(jù)庫服務(wù)端接收到寫請求的數(shù)據(jù)（數(shù)據(jù)在服務(wù)端的內(nèi)存中）。

(3)服務(wù)端調(diào)用write這個系統(tǒng)調(diào)用，將數(shù)據(jù)往磁盤上寫（數(shù)據(jù)在系統(tǒng)內(nèi)存的緩沖區(qū)中）。

(4)操作系統(tǒng)將緩沖區(qū)中的數(shù)據(jù)轉(zhuǎn)移到磁盤控制器上（數(shù)據(jù)在磁盤緩存中）。

(5)磁盤控制器將數(shù)據(jù)寫到磁盤的物理介質(zhì)中（數(shù)據(jù)真正落到磁盤上）。

1、故障分析:

寫操作大致有上面5個流程，下面我們結(jié)合上面的5個流程看一下各種級別的故障：

(1)當(dāng)數(shù)據(jù)庫系統(tǒng)故障時，這時候系統(tǒng)內(nèi)核還是完好的。那么此時只要我們執(zhí)行完了第3步，那么數(shù)據(jù)就是安全的，因為后續(xù)操作系統(tǒng)會來完成后面幾步，保證數(shù)據(jù)最終會落到磁盤上。

(2)當(dāng)系統(tǒng)斷電時，這時候上面5項中提到的所有緩存都會失效，并且數(shù)據(jù)庫和操作系統(tǒng)都會停止工作。所以只有當(dāng)數(shù)據(jù)在完成第5步后，才能保證在斷電后數(shù)據(jù)不丟失。

通過上面5步的了解，可能我們會希望搞清下面一些問題：

(1)數(shù)據(jù)庫多長時間調(diào)用一次write，將數(shù)據(jù)寫到內(nèi)核緩沖區(qū)？

(2)內(nèi)核多長時間會將系統(tǒng)緩沖區(qū)中的數(shù)據(jù)寫到磁盤控制器？

(3)磁盤控制器又在什么時候把緩存中的數(shù)據(jù)寫到物理介質(zhì)上？

對于第一個問題，通常數(shù)據(jù)庫層面會進行全面控制。

而對第二個問題，操作系統(tǒng)有其默認的策略，但是我們也可以通過POSIX API提供的fsync系列命令強制操作系統(tǒng)將數(shù)據(jù)從內(nèi)核區(qū)寫到磁盤控制器上。

對于第三個問題，好像數(shù)據(jù)庫已經(jīng)無法觸及，但實際上，大多數(shù)情況下磁盤緩存是被設(shè)置關(guān)閉的，或者是只開啟為讀緩存，也就是說寫操作不會進行緩存，直接寫到磁盤。

建議的做法是僅僅當(dāng)你的磁盤設(shè)備有備用電池時才開啟寫緩存。

2、數(shù)據(jù)損壞

所謂數(shù)據(jù)損壞，就是數(shù)據(jù)無法恢復(fù)，上面我們講的都是如何保證數(shù)據(jù)是確實寫到磁盤上去，但是寫到磁盤上可能并不意味著數(shù)據(jù)不會損壞。比如我們可能一次寫請求會進行兩次不同的寫操作，當(dāng)意外發(fā)生時，可能會導(dǎo)致一次寫操作安全完成，但是另一次還沒有進行。如果數(shù)據(jù)庫的數(shù)據(jù)文件結(jié)構(gòu)組織不合理，可能就會導(dǎo)致數(shù)據(jù)完全不能恢復(fù)的狀況出現(xiàn)。

這里通常也有三種策略來組織數(shù)據(jù)，以防止數(shù)據(jù)文件損壞到無法恢復(fù)的情況：

(1)第一種是最粗糙的處理，就是不通過數(shù)據(jù)的組織形式保證數(shù)據(jù)的可恢復(fù)性。而是通過配置數(shù)據(jù)同步備份的方式，在數(shù)據(jù)文件損壞后通過數(shù)據(jù)備份來進行恢復(fù)。實際上MongoDB在不開啟操作日志，通過配置Replica Sets時就是這種情況。

(2)另一種是在上面基礎(chǔ)上添加一個操作日志，每次操作時記一下操作的行為，這樣我們可以通過操作日志來進行數(shù)據(jù)恢復(fù)。因為操作日志是順序追加的方式寫的，所以不會出現(xiàn)操作日志也無法恢復(fù)的情況。這也類似于MongoDB開啟了操作日志的情況。

(3)更保險的做法是數(shù)據(jù)庫不進行舊數(shù)據(jù)的修改，只是以追加方式去完成寫操作，這樣數(shù)據(jù)本身就是一份日志，這樣就永遠不會出現(xiàn)數(shù)據(jù)無法恢復(fù)的情況了。實際上CouchDB就是此做法的優(yōu)秀范例。

二、Redis提供了RDB持久化和AOF持久化

1、RDB機制的優(yōu)勢和劣勢

RDB持久化是指在指定的時間間隔內(nèi)將內(nèi)存中的數(shù)據(jù)集快照寫入磁盤。

也是默認的持久化方式，這種方式是就是將內(nèi)存中數(shù)據(jù)以快照的方式寫入到二進制文件中,默認的文件名為dump.rdb。

A、優(yōu)勢

(1)一旦采用該方式，那么你的整個Redis數(shù)據(jù)庫將只包含一個文件，這樣非常方便進行備份。比如你可能打算沒1天歸檔一些數(shù)據(jù)。

(2)方便備份，我們可以很容易的將一個一個RDB文件移動到其他的存儲介質(zhì)上

(3)RDB 在恢復(fù)大數(shù)據(jù)集時的速度比 AOF 的恢復(fù)速度要快。

(4)RDB 可以最大化 Redis 的性能：父進程在保存 RDB 文件時唯一要做的就是 fork 出一個子進程，然后這個子進程就會處理接下來的所有保存工作，父進程無須執(zhí)行任何磁盤 I/O 操作。

B、劣勢

(1)如果你需要盡量避免在服務(wù)器故障時丟失數(shù)據(jù)，那么 RDB 不適合你。雖然 Redis 允許你設(shè)置不同的保存點（save point）來控制保存 RDB 文件的頻率，但是，因為RDB 文件需要保存整個數(shù)據(jù)集的狀態(tài)，所以它并不是一個輕松的操作。因此你可能會至少 5 分鐘才保存一次 RDB 文件。在這種情況下，一旦發(fā)生故障停機，你就可能會丟失好幾分鐘的數(shù)據(jù)。

(2)每次保存 RDB 的時候，Redis 都要 fork() 出一個子進程，并由子進程來進行實際的持久化工作。在數(shù)據(jù)集比較龐大時， fork() 可能會非常耗時，造成服務(wù)器在某某毫秒內(nèi)停止處理客戶端；如果數(shù)據(jù)集非常巨大，并且 CPU 時間非常緊張的話，那么這種停止時間甚至可能會長達整整一秒。雖然 AOF 重寫也需要進行 fork() ，但無論 AOF 重寫的執(zhí)行間隔有多長，數(shù)據(jù)的耐久性都不會有任何損失。

可以通過配置設(shè)置自動做快照持久化的方式。我們可以配置redis在n秒內(nèi)如果超過m個key被修改就自動做快照，下面是默認的快照保存配置

save 900 1 #900秒內(nèi)如果超過1個key被修改，則發(fā)起快照保存

save 300 10 #300秒內(nèi)容如超過10個key被修改，則發(fā)起快照保存

save 60 10000

2、RDB文件保存過程

(1)redis調(diào)用fork,現(xiàn)在有了子進程和父進程。

(2)父進程繼續(xù)處理client請求，子進程負責(zé)將內(nèi)存內(nèi)容寫入到臨時文件。由于os的寫時復(fù)制機制（copy on write)父子進程會共享相同的物理頁面，當(dāng)父進程處理寫請求時os會為父進程要修改的頁面創(chuàng)建副本，而不是寫共享的頁面。所以子進程的地址空間內(nèi)的數(shù) 據(jù)是fork時刻整個數(shù)據(jù)庫的一個快照。

(3)當(dāng)子進程將快照寫入臨時文件完畢后，用臨時文件替換原來的快照文件，然后子進程退出。

client 也可以使用save或者bgsave命令通知redis做一次快照持久化。save操作是在主線程中保存快照的，由于redis是用一個主線程來處理所有 client的請求，這種方式會阻塞所有client請求。所以不推薦使用。

另一點需要注意的是，每次快照持久化都是將內(nèi)存數(shù)據(jù)完整寫入到磁盤一次，并不是增量的只同步臟數(shù)據(jù)。如果數(shù)據(jù)量大的話，而且寫操作比較多，必然會引起大量的磁盤io操作，可能會嚴(yán)重影響性能。

3、AOF文件保存過程

redis會將每一個收到的寫命令都通過write函數(shù)追加到文件中(默認是 appendonly.aof)。

當(dāng)redis重啟時會通過重新執(zhí)行文件中保存的寫命令來在內(nèi)存中重建整個數(shù)據(jù)庫的內(nèi)容。當(dāng)然由于os會在內(nèi)核中緩存 write做的修改，所以可能不是立即寫到磁盤上。這樣aof方式的持久化也還是有可能會丟失部分修改。不過我們可以通過配置文件告訴redis我們想要通過fsync函數(shù)強制os寫入到磁盤的時機。有三種方式如下（默認是：每秒fsync一次）

appendonly yes //啟用aof持久化方式

# appendfsync always //每次收到寫命令就立即強制寫入磁盤，最慢的，但是保證完全的持久化，不推薦使用

appendfsync everysec //每秒鐘強制寫入磁盤一次，在性能和持久化方面做了很好的折中，推薦

# appendfsync no //完全依賴os，性能最好,持久化沒保證

AOF 的方式也同時帶來了另一個問題。持久化文件會變的越來越大。例如我們調(diào)用incr test命令100次，文件中必須保存全部的100條命令，其實有99條都是多余的。因為要恢復(fù)數(shù)據(jù)庫的狀態(tài)其實文件中保存一條set test 100就夠了。

為了壓縮aof的持久化文件。redis提供了bgrewriteaof命令。收到此命令redis將使用與快照類似的方式將內(nèi)存中的數(shù)據(jù) 以命令的方式保存到臨時文件中，最后替換原來的文件。具體過程如下

(1)redis調(diào)用fork ，現(xiàn)在有父子兩個進程

(2)子進程根據(jù)內(nèi)存中的數(shù)據(jù)庫快照，往臨時文件中寫入重建數(shù)據(jù)庫狀態(tài)的命令

父進程繼續(xù)處理client請求，除了把寫命令寫入到原來的aof文件中。同時把收到的寫命令緩存起來。這樣就能保證如果子進程重寫失敗的話并不會出問題。

當(dāng)子進程把快照內(nèi)容寫入已命令方式寫到臨時文件中后，子進程發(fā)信號通知父進程。然后父進程把緩存的寫命令也寫入到臨時文件。

(3)現(xiàn)在父進程可以使用臨時文件替換老的aof文件，并重命名，后面收到的寫命令也開始往新的aof文件中追加。

(4)需要注意到是重寫aof文件的操作，并沒有讀取舊的aof文件，而是將整個內(nèi)存中的數(shù)據(jù)庫內(nèi)容用命令的方式重寫了一個新的aof文件,這點和快照有點類似。

A、優(yōu)勢

(1)使用 AOF 持久化會讓 Redis 變得非常耐久（much more durable）：你可以設(shè)置不同的 fsync 策略，比如無 fsync ，每秒鐘一次 fsync ，或者每次執(zhí)行寫入命令時 fsync 。 AOF 的默認策略為每秒鐘 fsync 一次，在這種配置下，Redis 仍然可以保持良好的性能，并且就算發(fā)生故障停機，也最多只會丟失一秒鐘的數(shù)據(jù)（ fsync 會在后臺線程執(zhí)行，所以主線程可以繼續(xù)努力地處理命令請求）。

(2)AOF 文件是一個只進行追加操作的日志文件（append only log），因此對 AOF 文件的寫入不需要進行 seek ，即使日志因為某些原因而包含了未寫入完整的命令（比如寫入時磁盤已滿，寫入中途停機，等等）， redis-check-aof 工具也可以輕易地修復(fù)這種問題。
(3)Redis 可以在 AOF 文件體積變得過大時，自動地在后臺對 AOF 進行重寫：重寫后的新 AOF 文件包含了恢復(fù)當(dāng)前數(shù)據(jù)集所需的最小命令集合。整個重寫操作是絕對安全的，因為 Redis 在創(chuàng)建新 AOF 文件的過程中，會繼續(xù)將命令追加到現(xiàn)有的 AOF 文件里面，即使重寫過程中發(fā)生停機，現(xiàn)有的 AOF 文件也不會丟失。而一旦新 AOF 文件創(chuàng)建完畢，Redis 就會從舊 AOF 文件切換到新 AOF 文件，并開始對新 AOF 文件進行追加操作。

(4)AOF 文件有序地保存了對數(shù)據(jù)庫執(zhí)行的所有寫入操作，這些寫入操作以 Redis 協(xié)議的格式保存，因此 AOF 文件的內(nèi)容非常容易被人讀懂，對文件進行分析（parse）也很輕松。導(dǎo)出（export） AOF 文件也非常簡單：舉個例子，如果你不小心執(zhí)行了 FLUSHALL 命令，但只要 AOF 文件未被重寫，那么只要停止服務(wù)器，移除 AOF 文件末尾的 FLUSHALL 命令，并重啟 Redis ，就可以將數(shù)據(jù)集恢復(fù)到 FLUSHALL 執(zhí)行之前的狀態(tài)。

B、劣勢

(1)對于相同的數(shù)據(jù)集來說，AOF 文件的體積通常要大于 RDB 文件的體積。

(2)根據(jù)所使用的 fsync 策略，AOF 的速度可能會慢于 RDB 。在一般情況下，每秒 fsync 的性能依然非常高，而關(guān)閉 fsync 可以讓 AOF 的速度和 RDB 一樣快，即使在高負荷之下也是如此。不過在處理巨大的寫入載入時，RDB 可以提供更有保證的最大延遲時間（latency）。

(3)AOF 在過去曾經(jīng)發(fā)生過這樣的 bug ：因為個別命令的原因，導(dǎo)致 AOF 文件在重新載入時，無法將數(shù)據(jù)集恢復(fù)成保存時的原樣。（舉個例子，阻塞命令 BRPOPLPUSH 就曾經(jīng)引起過這樣的 bug 。）測試套件里為這種情況添加了測試：它們會自動生成隨機的、復(fù)雜的數(shù)據(jù)集，并通過重新載入這些數(shù)據(jù)來確保一切正常。雖然這種 bug 在 AOF 文件中并不常見，但是對比來說， RDB 幾乎是不可能出現(xiàn)這種 bug 的。

3、抉擇

一般來說，如果想達到足以媲美 PostgreSQL 的數(shù)據(jù)安全性，你應(yīng)該同時使用兩種持久化功能。

如果你非常關(guān)心你的數(shù)據(jù)，但仍然可以承受數(shù)分鐘以內(nèi)的數(shù)據(jù)丟失，那么你可以只使用 RDB 持久化。

其余情況我個人喜好選擇AOF

4、如果 AOF 文件出錯了，怎么辦？

服務(wù)器可能在程序正在對 AOF 文件進行寫入時停機，如果停機造成了 AOF 文件出錯（corrupt），那么 Redis 在重啟時會拒絕載入這個 AOF 文件，從而確保數(shù)據(jù)的一致性不會被破壞。

當(dāng)發(fā)生這種情況時，可以用以下方法來修復(fù)出錯的 AOF 文件：

(1)為現(xiàn)有的 AOF 文件創(chuàng)建一個備份。

(2)使用 Redis 附帶的 redis-check-aof 程序，對原來的 AOF 文件進行修復(fù)。

$ redis-check-aof --fix

(3)[可選]使用 diff -u 對比修復(fù)后的 AOF 文件和原始 AOF 文件的備份，查看兩個文件之間的不同之處。

重啟 Redis 服務(wù)器，等待服務(wù)器載入修復(fù)后的 AOF 文件，并進行數(shù)據(jù)恢復(fù)。

作者：SEian.G（苦練七十二變，笑對八十一難）

網(wǎng)站題目：深入理解redis的持久化
分享路徑：http://weahome.cn/article/ihcdgd.html

真实的国产乱ⅩXXX66竹夫人,五月香六月婷婷激情综合,亚洲日本VA一区二区三区,亚洲精品一区二区三区麻豆

深入理解redis的持久化

其他資訊

網(wǎng)站制作

企業(yè)服務(wù)

網(wǎng)站建設(shè)

服務(wù)器托管