一、概述
創(chuàng)新互聯(lián)建站是一家專注于成都網(wǎng)站建設、成都網(wǎng)站制作與策劃設計,張店網(wǎng)站建設哪家好?創(chuàng)新互聯(lián)建站做網(wǎng)站,專注于網(wǎng)站建設十多年,網(wǎng)設計領(lǐng)域的專業(yè)建站公司;建站業(yè)務涵蓋:張店等地區(qū)。張店做網(wǎng)站價格咨詢:18980820575MongoDB的正式版本都是偶數(shù)版本,x.x.x,主要版本(x.x)大約每年升級一次,小版本主要是修復問題,通常1-2個月發(fā)布一次。
MongoDB支持原生高可用:Application通過Driver連接到Primary節(jié)點,一個Primary節(jié)點連接多個Secondary節(jié)點。
MongoDB支持水平擴展,分片集群:Driver連接多個Mongos,Mongos連接多個Shard,每個Shard都是一個Primary和多個Secondary。
主要用于實現(xiàn)服務的高可用
MongoDB的復制集主要具備如下特征:
一個典型的復制集由3個以上具有投票權(quán)的節(jié)點構(gòu)成,一個Primary接受寫入操作和選舉時投票,兩個Secondary復制Primary節(jié)點數(shù)據(jù)和選舉時投票。
一個分片不超過3TB,盡量保證在2TB。常用索引必須容納進內(nèi)存。
需要多少個分片?
分片數(shù)量=max(所需存儲容量/單節(jié)點掛載容量, 工作集大小/單服務器內(nèi)存容量0.6, 并發(fā)總量/單節(jié)點并發(fā)量0.7)
如何選擇片鍵?
mongodump -h HostName:Port -d DatabaseName -c CollectionName
使用--oplog
參數(shù)實現(xiàn)增量備份。復制從mongodump從開始執(zhí)行到完成所有的oplog。會輸出到dump/oplog.bson
文件。
mongostore -h HostName:port -d DatabaseName -c CollectionName Filename.bson
使用--oplogReplay
參數(shù)實現(xiàn)增量恢復。通過—-oplogLimit
參數(shù)和--oplogFile
參數(shù)實現(xiàn)特定時間點的恢復。
在分片集群的備份中,多個分片可能在發(fā)生數(shù)據(jù)遷移和均衡,導致備份的數(shù)據(jù)發(fā)生錯亂,可以通過停止均衡器解決。
writeConcern參數(shù):決定一個寫操作落到多少個節(jié)點上才算成功。
用于追蹤變更,類似于觸發(fā)器,基于oplog實現(xiàn),返回的_id可用于斷點恢復,有個cursor進行追蹤,推送majority條件的變更。
MongoDB的優(yōu)勢?
支持插件式存儲引擎,WiredTiger存儲引擎和in-memory存儲引擎。
MongoDB支持的數(shù)據(jù)類型:
什么是mongod,默認參數(shù)有哪些?
MySQL和MongoDB的區(qū)別:
更新操作會立刻fsync到磁盤?
MongoDB支持的索引類型?
MongoDB在A:{B,C}上建立索引,查詢A:{B,C}和A:{C,B}都會使用索引嗎?
由于MongoDB索引使用B-tree樹原理,只會在A:{B,C}上使用索引。
如果塊移動操作(moveChunk)失敗了,我需要手動清除部分轉(zhuǎn)移的文檔嗎?
不需要,移動操作是一致并且是確定的。一次失敗后,移動操作會不斷重試。當完成后,數(shù)據(jù)只會出現(xiàn)在新的分片里。
數(shù)據(jù)在什么時候才會擴展到多個分片里?
MongoDB 分片是基于區(qū)域(range)的。所以一個集合(collection)中的所有的對象都被存放到一個塊(chunk)中,默認塊的大小是 64Mb。當數(shù)據(jù)容量超過64 Mb,才有可能實施一個遷移,只有當存在不止一個塊的時候,才會有多個分片獲取數(shù)據(jù)的選項。
更新一個正在被遷移的塊(Chunk)上的文檔時會發(fā)生什么?
更新操作會立即發(fā)生在舊的塊(Chunk)上,然后更改才會在所有權(quán)轉(zhuǎn)移前復制到新的分片上。
如果一個分片(Shard)停止或很慢的時候,發(fā)起一個查詢會怎樣?
如果一個分片停止了,除非查詢設置了 “Partial” 選項,否則查詢會返回一個錯誤。如果一個分片響應很慢,MongoDB 會等待它的響應。
什么是Arbiter?
仲裁節(jié)點不維護數(shù)據(jù)集。 仲裁節(jié)點的目的是通過響應其他副本集節(jié)點的心跳和選舉請求來維護副本集中的仲裁。
復制集節(jié)點類型有哪些?
MongoDB是OLTP數(shù)據(jù)庫,原則上MySQL和Oracle能做的事情,MongoDB也都可以。MongoDB具有原生的橫向擴展能力,靈活的模型支持,適合快速開發(fā)迭代,數(shù)據(jù)模型多變的場景,并且MongoDB使用了JSON數(shù)據(jù)結(jié)構(gòu),非常適合微服務領(lǐng)域。
基于功能的選擇:
MongoDB | 傳統(tǒng)關(guān)系型數(shù)據(jù)庫 | |
---|---|---|
億級以上的數(shù)據(jù)量支持 | Easy | 分庫分表 |
靈活的表結(jié)構(gòu) | Easy | 數(shù)據(jù)字典,關(guān)聯(lián)查詢 |
高并發(fā)讀 | Easy | Hard |
高并發(fā)寫 | Easy | Hard |
跨地區(qū)的集群 | Easy | Hard |
數(shù)據(jù)分片 | Easy | 中間件 |
地址位置查詢 | 完整支持 | PostGreSQL還可以,其他的很麻煩 |
聚合計算 | Easy | GroupBY,復雜的SQL |
異構(gòu)數(shù)據(jù) | Easy | 數(shù)據(jù)字典,關(guān)聯(lián)查詢 |
大、寬表 | Easy | 性能局限 |
基于場景的選擇:
移動端應用、小程序
場景特點:基于RESTful API,快速迭代,數(shù)據(jù)結(jié)構(gòu)頻繁變化,大部分功能基于地理信息,爆發(fā)式的增長,高可用
業(yè)界案例:Keep(說實在的, 健身還不如專門請個私教單獨一對一),摩拜單車,ADP
電商的海量商品數(shù)據(jù)
場景特點:商品信息包羅萬象,數(shù)據(jù)庫模式設計困難
業(yè)界案例:京東商城,小紅書,GAP
內(nèi)容管理:
場景特點:內(nèi)容數(shù)據(jù)多樣,擴展困難
業(yè)界案例:Adobe AEM,SiteCore
物聯(lián)網(wǎng)IoT
場景特點:傳感器數(shù)據(jù)結(jié)構(gòu)往往是半結(jié)構(gòu)化數(shù)據(jù),傳感器實時采集的數(shù)據(jù)量巨大,容易增長到百億級別
業(yè)界案例:華為、Bosch、MindSphere
SaaS應用
場景特點:多租戶模式,需求多變,數(shù)據(jù)增長快
業(yè)界案例:ADP、Teambition
主機分流
場景特點:高性能查詢,實時同步機制
業(yè)界案例:金融行業(yè)
實時在線分析
場景特點:流數(shù)據(jù)計算,快速計算,秒級響應
業(yè)界案例:MongoDB緩存機制、MongoDB聚合框架、微分片架構(gòu)
關(guān)系型遷移到MongoDB承載更多的數(shù)據(jù)和并發(fā)
場景特點:數(shù)據(jù)增長導致性能低,分庫分表方案復雜
業(yè)界案例:頭條、網(wǎng)易、百度、東航、中行
從傳統(tǒng)的關(guān)系型數(shù)據(jù)庫遷移到MongoDB需要綜合考慮的幾個問題:
總體架構(gòu)
模式設計
表結(jié)構(gòu)整合為JSON文檔
SQL語句/存儲過程/ORM層
原始SQL
存儲過程特性
ORM框架
數(shù)據(jù)遷移
數(shù)據(jù)遷移的幾個方式:
(1)數(shù)據(jù)庫導出導入,導出JSON或者CSV
(2)ETL批量遷移工具,Kettle、Talend
(3)實時同步工具,infomatica、Tapdata(會運行一個Agent),一般是解析日志模式
(4)應用主動遷移
MongoDB作為Spark的存儲方案,MongoDB相比HDFS更加細粒度存儲,并且支持結(jié)構(gòu)化存儲。MongoDB支持索引機制,使得Spark的讀取更加快速,HDFS是一次寫,多次讀,但是MongoDB適合Spark的讀寫混合場景。MongoDB是在線式存儲,毫秒級的SLA。
MongoDB可以通過BI Connector實現(xiàn)與SQL的結(jié)合。BI Connector會自動產(chǎn)生DRDL映射文件,然后我們根據(jù)映射文件來編寫SQL語句實現(xiàn)數(shù)據(jù)展示。
BI Connector是企業(yè)版的,并且是一個獨立的服務。
BI Connector暴露的是MySQL驅(qū)動構(gòu)建的解釋器,然后作為一個虛擬的MySQL服務。
容災級別 | 描述 | RPO | RTO |
---|---|---|---|
Level0 | 無災備源,只有本地的數(shù)據(jù)備份 | 24小時 | 4小時 |
Level1 | 本地備份+異地保存,將關(guān)鍵數(shù)據(jù)保存并送到異地 | 24小時 | 8小時 |
Level2 | 雙中心主備,通過網(wǎng)絡建立熱點備份 | 秒級 | 數(shù)分鐘到半小時 |
Level3 | 雙中心雙活,互相進行數(shù)據(jù)備份 | 秒級 | 秒級 |
Level4 | 雙中心雙活+異地熱備,當一個城市的兩個中心不可用時切換 | 秒級 | 分鐘級 |
網(wǎng)絡層解決方案
GSLB實現(xiàn)MongoDB負載均衡器的健康檢查,通過域名實現(xiàn)應用層的切換。
應用層解決方案
使用負載均衡技術(shù),虛擬IP技術(shù),使用同一個Session,使用同一套數(shù)據(jù)。
使用HAProxy或者Nginx作為本地的SLB本地負載均衡器。
數(shù)據(jù)庫層解決方案
通過日志同步或者存儲鏡像實現(xiàn)數(shù)據(jù)拷貝。
復制集跨中心2+2+1解決方案
2+2+1保證了主中心的高可用,oplog同步實現(xiàn)了毫秒級的拷貝。
由于復制集只解決了讀取的問題,寫入還是要在Primary上進行所以不能夠保證幾個國家的用戶體驗。
全球多寫本質(zhì)上是一個特殊的分片集群。將集群中的分片節(jié)點分區(qū)域部署。要實現(xiàn)全球分片多寫,那么要實現(xiàn)以下三點條件:
針對要分片的數(shù)據(jù)集合,模型中增加一個區(qū)域字段。
給集群中的每個分片添加區(qū)域標簽。
sh.addShardTag("shard0", "Asia");
為每個區(qū)域指定屬于這個區(qū)域的分片塊范圍。
sh.addShardRange("tableName", {"location": "China"}, "Asia");
全球多寫的事務性問題:
當海外用戶訪問讀取數(shù)據(jù)時,希望是從海外本地讀取,因此需要設置readPreference:"nearest"
。
writeConcern:"majority"
。readPreference:"nearset"
就會保證從本地讀取就近的數(shù)據(jù)。writeConcern:"majority"
需要寫入大部分節(jié)點。當然,MongoDB也可以在國內(nèi)和海外向Oracle那樣同時部署兩套集群,通過第三方工具實現(xiàn)同步,中間也需要處理數(shù)據(jù)沖突問題。常見的中間件有:Tapdata和MongoShake。這兩個第三方中間件也是基于oplog的。
tcp_keepalive_time
設置為120秒,容忍網(wǎng)絡問題。MongoDB中的索引是特殊結(jié)構(gòu),索引存儲在易于遍歷的數(shù)據(jù)集合中,而且使用BTree結(jié)構(gòu)。
創(chuàng)建索引
db.collection.createIndex(,
參數(shù) | 數(shù)據(jù)類型 | 描述 |
---|---|---|
background | Boolean | 創(chuàng)建索引會阻塞數(shù)據(jù)庫操作,可以指定為后臺操作。 |
unique | Boolean | 是否建立唯一索引 |
name | String | 索引的名稱 |
dropDups | Boolean | 3.0版本廢棄,建立索引時是否刪除重復記錄 |
sparse | Boolean | 對文檔中不存在的字段數(shù)據(jù)不建立索引 |
expireAfterSeconds | Integer | 秒,設定索引的TTL |
v | Index version | 索引的版本號 |
weight | Document | 索引權(quán)重值,數(shù)值在1-99999之間 |
default_language | String | 對于文本類型的索引,決定了分詞器規(guī)則,默認為英語 |
language_override | String | 對于文本類型的索引,指定了包含在文檔中的字段名 |
查看索引
db.collection.getIndexs();
刪除索引
db.collection.dropIndexs();
db.collection.dropIndex();
查看創(chuàng)建過程和終止
db.currentOp();
db.killOp();
使用情況
// 獲取索引訪問信息
$indexStats
// 返回查詢計劃
explain()
// 控制索引, 強制MongoDB使用特定索引進行查詢
hint()
MongoDB可以在任何字段上創(chuàng)建索引,默認情況下會在_id
字段創(chuàng)建索引,_id
索引時為了防止客戶端具有相同的值創(chuàng)建的索引,該索引無法刪除。在分片集群中使用_id
索引。
將多個鍵組合到一起,這樣可以加速匹配多個鍵的查詢。
db.collection.createIndex( { : , : , ... } )
MongoDB使用多鍵索引為數(shù)組的每個元素創(chuàng)建索引,多鍵索引可以建立在字符串、數(shù)字、內(nèi)嵌文檔類型的數(shù)組上。如果創(chuàng)建的字段包含數(shù)組的值,那么MongoDB將會自動確定是否創(chuàng)建索引。
db.coll.createIndex( { : < 1 or -1 > } )
MongoDB機制提供了全文索引類型,支持在集合中搜索字符串。
db.collection.createIndex( { key: "text",key:"text" ..... } )
MongoDB提供權(quán)重以及通配符的創(chuàng)建方式。查詢方式多個字符串空格隔開,排除查詢使用“-”。每個全文索引可以通過設置權(quán)重來分配不同的搜索程度,默認權(quán)重為1,對于文檔中的每個索引字段,MongoDB將匹配數(shù)乘以權(quán)重并將結(jié)果相加。 使用此總和,MongoDB然后計算文檔的分數(shù)
$text
表達式就無法使用hint()函數(shù)散列索引使用散列函數(shù)來計算索引字段值的散列值。 散列函數(shù)會折疊嵌入的文檔并計算整個值的散列值,但不支持多鍵(即數(shù)組)索引。
db.collection.createIndex( { _id: "hashed" } )
散列索引支持使用散列分片鍵進行分片。 基于散列的分片使用字段的散列索引作為分片鍵來分割整個分片群集中的數(shù)據(jù)。
通過在命令行方式加入
--auth
參數(shù)或者在配置文件添加authorization: enabled
開啟安全選項。使用命令行客戶端操作:
mongo -uUsername -pPassword --authenticationDatabase DbName
MongoDB的Role建立在Action和Resource上,Action定義了一種動作,Resource表示某個動作可以操作的資源。MongoDB內(nèi)置權(quán)限角色繼承關(guān)系圖如下:
自定義角色和用戶分別可以使用createRole()和createUser()。
MongoDB支持TLS/SSL來加密所有的網(wǎng)絡數(shù)據(jù)傳輸,不管是內(nèi)部節(jié)點還是客戶端到服務器。
審計日志記錄到syslog:
--auditDestination syslog
審計日志記錄到指定文件:
--auditDestination file --auditFormat JSON --auditPath /path/to/auditLog.json
對刪除進行審計:
--auditDestination file --auditFormat JSON --auditPath /path/to/auditLog.json --auditFilter '{atype: {$in: ["dropCollection"]}}'
用于了解MongoDB運行狀態(tài)的工具。
用于了解集合壓力的工具
MongoDB會記錄超過100ms的查詢,會將執(zhí)行計劃輸出。
pip install mtools
常用指令:
https://github.com/rueckstiess/mtools
GridFS是MongoDB的一個子模塊,主要用于在MongoDB中存儲文件,相當于MongoDB內(nèi)置的一個分布式文件系統(tǒng)。本質(zhì)上還是講文件的數(shù)據(jù)分塊存儲在集合中,默認的文件集合分為fs.files
和fs.chunks
。fs.files是存儲文件的基本信息,比如文件名,大小,上傳時間,MD5等。fs.chunks是存儲文件真正數(shù)據(jù)的地方,一個文件會被分割成多個chunk塊進行存儲,一般為256KB/個。
GridFS的好處是你不用單獨去搭建一個文件系統(tǒng),直接使用Mongodb自帶的即可,備份,分片都依賴MongoDB,維護起來也方便。
另外有需要云服務器可以了解下創(chuàng)新互聯(lián)cdcxhl.cn,海內(nèi)外云服務器15元起步,三天無理由+7*72小時售后在線,公司持有idc許可證,提供“云服務器、裸金屬服務器、高防服務器、香港服務器、美國服務器、虛擬主機、免備案服務器”等云主機租用服務以及企業(yè)上云的綜合解決方案,具有“安全穩(wěn)定、簡單易用、服務可用性高、性價比高”等特點與優(yōu)勢,專為企業(yè)上云打造定制,能夠滿足用戶豐富、多元化的應用場景需求。