對于數(shù)據(jù)量比較小的場景,使用官方的mongodump/mongorestore工具進行全量的備份和恢復(fù)就足夠了。mongodump可以連上一個正在服務(wù)的mongod節(jié)點進行邏輯熱備份。其主要原理是遍歷所有集合,然后將文檔一條條讀出來,支持并發(fā)dump多個集合,并且支持歸檔和壓縮,可以輸出到一個文件(或標準輸出)(對原理感興趣可以參見我之前寫的兩篇文章Mongodump的archive(歸檔)模式原理解析以及Mongorestore的archive(歸檔)模式恢復(fù)原理解析)。同樣,mongorestore則是連上一個正在服務(wù)的mongod節(jié)點進行邏輯恢復(fù)。其主要原理是將備份出來的數(shù)據(jù)再一條條寫回到數(shù)據(jù)庫中。
創(chuàng)新互聯(lián)建站成立十多年來,這條路我們正越走越好,積累了技術(shù)與客戶資源,形成了良好的口碑。為客戶提供成都網(wǎng)站設(shè)計、做網(wǎng)站、網(wǎng)站策劃、網(wǎng)頁設(shè)計、申請域名、網(wǎng)絡(luò)營銷、VI設(shè)計、網(wǎng)站改版、漏洞修補等服務(wù)。網(wǎng)站是否美觀、功能強大、用戶體驗好、性價比高、打開快等等,這些對于網(wǎng)站建設(shè)都非常重要,創(chuàng)新互聯(lián)建站通過對建站技術(shù)性的掌握、對創(chuàng)意設(shè)計的研究為客戶提供一站式互聯(lián)網(wǎng)解決方案,攜手廣大客戶,共同發(fā)展進步。
mongodump執(zhí)行過程由于會遍歷所有數(shù)據(jù),因此會對MongoDB性能有影響,最好在備節(jié)點執(zhí)行(最好是hidden,需檢查備節(jié)點數(shù)據(jù)同步是否正常)。
在mongodump執(zhí)行過程中由于數(shù)據(jù)庫還有新的修改,直接運行dump出來的結(jié)果不是一個一致的快照,需要使用一個『--oplog』的選項來將這個過程中的oplog也一塊dump下來(使用mongorestore進行恢復(fù)時對應(yīng)要使用--oplogReplay選項對oplog進行重放)。而由于MongoDB的oplog是一個固定大小的特殊集合,當(dāng)oplog集合達到配置的大小時舊的oplog會被滾掉以為新的oplog騰出空間。在使用『--oplog』選項進行dump時,mongodump會在dump集合數(shù)據(jù)前獲取當(dāng)時最新的oplog時間點,并在集合數(shù)據(jù)dump完畢之后再次檢查這個時間點的oplog是否還在,如果dump過程很長,oplog空間又不夠,oplog被滾掉就會dump失敗。因此在dump前最好檢查一下oplog的配置大小以及目前oplog的增長情況(可結(jié)合業(yè)務(wù)寫入量及oplog平均大小進行粗略估計),確保dump不會失敗。目前我們阿里云MongoDB服務(wù)針對oplog做了彈性擴縮容的優(yōu)化,能夠確保在邏輯備份過程中oplog不被滾掉,一定能夠備份成功。
對于集合數(shù)據(jù),mongodump出來的結(jié)果是一個個bson文件。而對于集合的索引,則是描述在一個metadata的json文件里,里面還包含創(chuàng)建集合時所使用的選項。在使用mongorestore進行恢復(fù)時,會在集合數(shù)據(jù)恢復(fù)完畢之后進行對應(yīng)的索引創(chuàng)建。
對于數(shù)據(jù)量很大的場景,如果使用mongodump/mongorestore進行備份和恢復(fù),需要的時間可能會很長。對于備份來說,最主要的問題就是備份所需時間越長,oplog被滾掉的幾率就越大,備份失敗的幾率也就越大。而對于恢復(fù)來說,由于恢復(fù)過程還涉及到索引的創(chuàng)建,如果除了數(shù)據(jù)量大,還有很多索引,所需花費的時間就更長了。遇到像爐石這種數(shù)據(jù)災(zāi)難,恢復(fù)時間當(dāng)然是越短越好,畢竟在游戲行業(yè)分分鐘的流水都很可觀。這時候就需要物理備份出場了,物理備份,顧名思義就是通過物理拷貝數(shù)據(jù)文件實現(xiàn)備份。在恢復(fù)時可以直接使用物理備份拷貝出來的數(shù)據(jù)文件,直接啟動mongod。物理備份最大的好處是速度快,恢復(fù)時也不需要再建索引。
物理備份通過拷貝數(shù)據(jù)文件來實現(xiàn),這要求所有被拷貝的數(shù)據(jù)文件必須是一個一致的數(shù)據(jù)快照。因此物理備份的實施方法和MongoDB采用的存儲引擎有關(guān),并且,根據(jù)是否配置MongoDB打開了Journal,在實施的細節(jié)上會有一些不同,具體可參考官方文檔。不管使用何種存儲引擎,在3.2版本之后,都可以用以下方法實現(xiàn)物理備份:
通過mongoshell執(zhí)行以下命令以確保所有的寫操作都flush到磁盤并禁止新的寫入:
db.fsyncLock();
利用底層文件系統(tǒng)層或邏輯卷的快照功能對MongoDB的數(shù)據(jù)目錄做快照,或直接通過cp、scp、tar等命令拷貝數(shù)據(jù)目錄。
還是在剛才的mongoshell上(這里需要保證和剛剛是同一個連接),執(zhí)行以下命令以重新允許新的寫入:
db.fsyncUnLock();
由于執(zhí)行db.fsyncLock()會加數(shù)據(jù)庫的全局寫鎖,這時數(shù)據(jù)庫會處于一個不可訪問的狀態(tài),因此物理備份最好也在備節(jié)點上執(zhí)行(最好是hidden,注意同樣需要確保物理備份完成之后節(jié)點的oplog能追上主節(jié)點)。目前我們阿里云MongoDB團隊已經(jīng)研發(fā)出了無需停寫服務(wù)的物理熱備份手段,相信很快就可以讓大家用上,盡請期待!
MongoDB的增量備份可以通過持續(xù)抓取oplog來實現(xiàn),這個目前沒有現(xiàn)成的工具可以利用,需要自己代碼實現(xiàn)。抓取oplog主要的難題也和使用mongodump進行全量備份一樣,需確保要抓取的oplog不被滾掉。目前我們阿里云MongoDB服務(wù)實現(xiàn)了自動增量備份的功能,結(jié)合全量備份可以實現(xiàn)任意時間點恢復(fù)功能。
爐石是不分服的,因此它后面也有可能是使用分布式數(shù)據(jù)庫。對于分布式數(shù)據(jù)庫來說,備份和恢復(fù)比單機數(shù)據(jù)庫更加復(fù)雜。分布式數(shù)據(jù)庫包含多個節(jié)點,并且通常包含不同角色的節(jié)點。以MongoDB的Sharding集群為例,它包含一個保存元數(shù)據(jù)的config server以及若干個保存數(shù)據(jù)的shard。其中最主要的元數(shù)據(jù)就是數(shù)據(jù)在shard之間的分布情況。對于多個節(jié)點的備份,其中一個難題是保證所有節(jié)點備份的數(shù)據(jù)是同一個時間點的,常規(guī)采用的手段是停止外部寫入后進行備份,這在互聯(lián)網(wǎng)服務(wù)中顯然不可接受。退而求其次,可以在停止接受同步的備節(jié)點上進行備份,這樣可以得到一個時間大致接近的備份。另外一個難題是各數(shù)據(jù)節(jié)點之間通常存在數(shù)據(jù)遷移,而數(shù)據(jù)遷移就涉及到起碼2個以上數(shù)據(jù)節(jié)點的數(shù)據(jù)修改以及元數(shù)據(jù)節(jié)點的數(shù)據(jù)修改,如果在備份過程中發(fā)生數(shù)據(jù)遷移,很難保證備份出來的數(shù)據(jù)和元數(shù)據(jù)是一個一致的狀態(tài)。因此通常在備份過程中需要關(guān)閉數(shù)據(jù)遷移。MongoDB官方的文檔指導(dǎo)步驟就是采用這個思路,先關(guān)閉負責(zé)數(shù)據(jù)遷移的balancer,然后依次在config server和各個shard的備節(jié)點上進行備份。關(guān)閉數(shù)據(jù)遷移最大的問題是關(guān)閉期間集群無法實現(xiàn)數(shù)據(jù)均衡,除了會影響集群的訪問性能外,還造成資源的浪費,這在數(shù)據(jù)量較大,所需備份時間較長時可能造成比較大的影響。