NoSQL太火,冒出太多產(chǎn)品了,保守估計(jì)也成百上千了。
創(chuàng)新互聯(lián)公司于2013年開始,是專業(yè)互聯(lián)網(wǎng)技術(shù)服務(wù)公司,擁有項(xiàng)目做網(wǎng)站、成都網(wǎng)站制作網(wǎng)站策劃,項(xiàng)目實(shí)施與項(xiàng)目整合能力。我們以讓每一個(gè)夢(mèng)想脫穎而出為使命,1280元蚌埠做網(wǎng)站,已為上家服務(wù),為蚌埠各地企業(yè)和個(gè)人服務(wù),聯(lián)系電話:028-86922220
互聯(lián)網(wǎng)公司常用的基本集中在以下幾種,每種只舉一個(gè)比較常見或者應(yīng)用比較成功的例子吧。
1. In-Memory KV Store : Redis
in memory key-value store,同時(shí)提供了更加豐富的數(shù)據(jù)結(jié)構(gòu)和運(yùn)算的能力,成功用法是替代memcached,通過checkpoint和commit log提供了快速的宕機(jī)恢復(fù),同時(shí)支持replication提供讀可擴(kuò)展和高可用。
2. Disk-Based KV Store: Leveldb
真正基于磁盤的key-value storage, 模型單一簡(jiǎn)單,數(shù)據(jù)量不受限于內(nèi)存大小,數(shù)據(jù)落盤高可靠,Google的幾位大神出品的精品,LSM模型天然寫優(yōu)化,順序?qū)懕P的方式對(duì)于新硬件ssd再適合不過了,不足是僅提供了一個(gè)庫(kù),需要自己封裝server端。
3. Document Store: Mongodb
分布式nosql,具備了區(qū)別mysql的最大亮點(diǎn):可擴(kuò)展性。mongodb 最新引人的莫過于提供了sql接口,是目前nosql里最像mysql的,只是沒有ACID的特性,發(fā)展很快,支持了索引等特性,上手容易,對(duì)于數(shù)據(jù)量遠(yuǎn)超內(nèi)存限制的場(chǎng)景來(lái)說,還需要慎重。
4. Column Table Store: HBase
這個(gè)富二代似乎不用贅述了,最大的優(yōu)勢(shì)是開源,對(duì)于普通的scan和基于行的get等基本查詢,性能完全不是問題,只是只提供裸的api,易用性上是短板,可擴(kuò)展性方面是最強(qiáng)的,其次坐上了Hadoop的快車,社區(qū)發(fā)展很快,各種基于其上的開源產(chǎn)品不少,來(lái)解決諸如join、聚集運(yùn)算等復(fù)雜查詢。
基本含義NoSQL(NoSQL = Not Only SQL ),意即“不僅僅是SQL”,是一項(xiàng)全新的數(shù)據(jù)庫(kù)革命性運(yùn)動(dòng),早期就有人提出,發(fā)展至2009年趨勢(shì)越發(fā)高漲。NoSQL的擁護(hù)者們提倡運(yùn)用非關(guān)系型的數(shù)據(jù)存儲(chǔ),相對(duì)于鋪天蓋地的關(guān)系型數(shù)據(jù)庫(kù)運(yùn)用,這一概念無(wú)疑是一種全新的思維的注入。NoSQLNoSQL數(shù)據(jù)庫(kù)的四大分類鍵值(Key-Value)存儲(chǔ)數(shù)據(jù)庫(kù)這一類數(shù)據(jù)庫(kù)主要會(huì)使用到一個(gè)哈希表,這個(gè)表中有一個(gè)特定的鍵和一個(gè)指針指向特定的數(shù)據(jù)。Key/value模型對(duì)于IT系統(tǒng)來(lái)說的優(yōu)勢(shì)在于簡(jiǎn)單、易部署。但是如果DBA只對(duì)部分值進(jìn)行查詢或更新的時(shí)候,Key/value就顯得效率低下了。[3] 舉例如:Tokyo Cabinet/Tyrant, Redis, Voldemort, Oracle BDB.列存儲(chǔ)數(shù)據(jù)庫(kù)。這部分?jǐn)?shù)據(jù)庫(kù)通常是用來(lái)應(yīng)對(duì)分布式存儲(chǔ)的海量數(shù)據(jù)。鍵仍然存在,但是它們的特點(diǎn)是指向了多個(gè)列。這些列是由列家族來(lái)安排的。如:Cassandra, HBase, Riak.文檔型數(shù)據(jù)庫(kù)文檔型數(shù)據(jù)庫(kù)的靈感是來(lái)自于Lotus Notes辦公軟件的,而且它同第一種鍵值存儲(chǔ)相類似。該類型的數(shù)據(jù)模型是版本化的文檔,半結(jié)構(gòu)化的文檔以特定的格式存儲(chǔ),比如JSON。文檔型數(shù)據(jù)庫(kù)可 以看作是鍵值數(shù)據(jù)庫(kù)的升級(jí)版,允許之間嵌套鍵值。而且文檔型數(shù)據(jù)庫(kù)比鍵值數(shù)據(jù)庫(kù)的查詢效率更高。如:CouchDB, MongoDb. 國(guó)內(nèi)也有文檔型數(shù)據(jù)庫(kù)SequoiaDB,已經(jīng)開源。圖形(Graph)數(shù)據(jù)庫(kù)圖形結(jié)構(gòu)的數(shù)據(jù)庫(kù)同其他行列以及剛性結(jié)構(gòu)的SQL數(shù)據(jù)庫(kù)不同,它是使用靈活的圖形模型,并且能夠擴(kuò)展到多個(gè)服務(wù)器上。NoSQL數(shù)據(jù)庫(kù)沒有標(biāo)準(zhǔn)的查詢語(yǔ)言(SQL),因此進(jìn)行數(shù)據(jù)庫(kù)查詢需要制定數(shù)據(jù)模型。許多NoSQL數(shù)據(jù)庫(kù)都有REST式的數(shù)據(jù)接口或者查詢API。[2] 如:Neo4J, InfoGrid, Infinite Graph.因此,我們總結(jié)NoSQL數(shù)據(jù)庫(kù)在以下的這幾種情況下比較適用:1、數(shù)據(jù)模型比較簡(jiǎn)單;2、需要靈活性更強(qiáng)的IT系統(tǒng);3、對(duì)數(shù)據(jù)庫(kù)性能要求較高;4、不需要高度的數(shù)據(jù)一致性;5、對(duì)于給定key,比較容易映射復(fù)雜值的環(huán)境。
關(guān)系數(shù)據(jù)庫(kù)模型已經(jīng)流行了幾十年了,但是一種新類型的數(shù)據(jù)庫(kù)——被稱為NoSQL,正在引起企業(yè)的注意。下面是關(guān)于它的優(yōu)勢(shì)和劣勢(shì)的一個(gè)概述。二十多年以來(lái),對(duì)數(shù)據(jù)庫(kù)管理來(lái)說,關(guān)系數(shù)據(jù)庫(kù)(RDBMS)模型一直是一個(gè)占統(tǒng)治地位的數(shù)據(jù)庫(kù)模型。但是,今天,非關(guān)系數(shù)據(jù)庫(kù),“云”數(shù)據(jù)庫(kù),或“NoSQL”數(shù)據(jù)庫(kù)作為關(guān)系數(shù)據(jù)庫(kù)以外的一些選擇,正在引起大家的廣泛關(guān)注。在這篇文章里,我們將主要關(guān)注那些非關(guān)系的NoSQL數(shù)據(jù)庫(kù)的十大利弊:包括五大優(yōu)勢(shì)和五大挑戰(zhàn)。
NoSQL的五大優(yōu)勢(shì)
1,靈活的可擴(kuò)展性
多年以來(lái),數(shù)據(jù)庫(kù)管理員們都是通過“縱向擴(kuò)展”的方式(當(dāng)數(shù)據(jù)庫(kù)的負(fù)載增加的時(shí)候,購(gòu)買更大型的服務(wù)器來(lái)承載增加的負(fù)載)來(lái)進(jìn)行擴(kuò)展的,而不是通過“橫向擴(kuò)展”的方式(當(dāng)數(shù)據(jù)庫(kù)負(fù)載增加的時(shí)候,在多臺(tái)主機(jī)上分配增加的負(fù)載)來(lái)進(jìn)行擴(kuò)展。但是,隨著交易率和可用性需求的增加,數(shù)據(jù)庫(kù)也正在遷移到云端或虛擬化環(huán)境中,“橫向擴(kuò)展”在commodity hardware方面的經(jīng)濟(jì)優(yōu)勢(shì)變得更加明顯了,對(duì)各大企業(yè)來(lái)說,這種“誘惑”是無(wú)法抗拒的。
在commodity clusters上,要對(duì)RDBMS做“橫向擴(kuò)展”,并不是很容易,但是各種新類型的NoSQL數(shù)據(jù)庫(kù)主要是為了進(jìn)行透明的擴(kuò)展,來(lái)利用新節(jié)點(diǎn)而設(shè)計(jì)的,而且,它們通常都是為了低成本的commodity hardware而設(shè)計(jì)的。
2,大數(shù)據(jù)
在過去的十年里,正如交易率發(fā)生了翻天覆地的增長(zhǎng)一樣,需要存儲(chǔ)的數(shù)據(jù)量也發(fā)生了急劇地膨脹。O’Reilly把這種現(xiàn)象稱為:“數(shù)據(jù)的工業(yè)革命”。為了滿足數(shù)據(jù)量增長(zhǎng)的需要,RDBMS的容量也在日益增加,但是,對(duì)一些企業(yè)來(lái)說,隨著交易率的增加,單一數(shù)據(jù)庫(kù)需要管理的數(shù)據(jù)約束的數(shù)量也變得越來(lái)越讓人無(wú)法忍受了?,F(xiàn)在,大量的“大數(shù)據(jù)”可以通過NoSQL系統(tǒng)(例如:Hadoop)來(lái)處理,它們能夠處理的數(shù)據(jù)量遠(yuǎn)遠(yuǎn)超出了最大型的RDBMS所能處理的極限。
3,“永別了”!DBA們?。ㄔ僖姡浚?/p>
在過去的幾年里,雖然一些RDBMS供應(yīng)商們聲稱在可管理性方面做出了很多的改進(jìn),但是高端的RDBMS系統(tǒng)維護(hù)起來(lái)仍然十分昂貴,而且還需要訓(xùn)練有素的DBA們的協(xié)助。DBA們需要親自參與高端的RDBMS系統(tǒng)的設(shè)計(jì),安裝和調(diào)優(yōu)。
NoSQL數(shù)據(jù)庫(kù)從一開始就是為了降低管理方面的要求而設(shè)計(jì)的:從理論上來(lái)說,自動(dòng)修復(fù),數(shù)據(jù)分配和簡(jiǎn)單的數(shù)據(jù)模型的確可以讓管理和調(diào)優(yōu)方面的要求降低很多。但是,DBA的死期將至的謠言未免有些過于夸張了??偸切枰腥藢?duì)關(guān)鍵性的數(shù)據(jù)庫(kù)的性能和可用性負(fù)責(zé)的。
Membase
Membase 是 NoSQL 家族的一個(gè)新的重量級(jí)的成員。Membase是開源項(xiàng)目,源代碼采用了Apache2.0的使用許可。該項(xiàng)目托管在GitHub.Source tarballs上,可以下載beta版本的Linux二進(jìn)制包。該產(chǎn)品主要是由North Scale的memcached核心團(tuán)隊(duì)成員開發(fā)完成,其中還包括Zynga和NHN這兩個(gè)主要貢獻(xiàn)者的工程師,這兩個(gè)組織都是很大的在線游戲和社區(qū)網(wǎng)絡(luò)空間的供應(yīng)商。
Membase容易安裝、操作,可以從單節(jié)點(diǎn)方便的擴(kuò)展到集群,而且為memcached(有線協(xié)議的兼容性)實(shí)現(xiàn)了即插即用功能,在應(yīng)用方面為開發(fā)者和經(jīng)營(yíng)者提供了一個(gè)比較低的門檻。做為緩存解決方案,Memcached已經(jīng)在不同類型的領(lǐng)域(特別是大容量的Web應(yīng)用)有了廣泛的使用,其中 Memcached的部分基礎(chǔ)代碼被直接應(yīng)用到了Membase服務(wù)器的前端。
通過兼容多種編程語(yǔ)言和框架,Membase具備了很好的復(fù)用性。在安裝和配置方面,Membase提供了有效的圖形化界面和編程接口,包括可配置 的告警信息。
Membase的目標(biāo)是提供對(duì)外的線性擴(kuò)展能力,包括為了增加集群容量,可以針對(duì)統(tǒng)一的節(jié)點(diǎn)進(jìn)行復(fù)制。 另外,對(duì)存儲(chǔ)的數(shù)據(jù)進(jìn)行再分配仍然是必要的。
這方面的一個(gè)有趣的特性是NoSQL解決方案所承諾的可預(yù)測(cè)的性能,類準(zhǔn)確性的延遲和吞吐量。通過如下方式可以獲得上面提到的特性:
◆ 自動(dòng)將在線數(shù)據(jù)遷移到低延遲的存儲(chǔ)介質(zhì)的技術(shù)(內(nèi)存,固態(tài)硬盤,磁盤)
◆ 可選的寫操作一一異步,同步(基于復(fù)制,持久化)
◆ 反向通道再平衡[未來(lái)考慮支持]
◆ 多線程低鎖爭(zhēng)用
◆ 盡可能使用異步處理
◆ 自動(dòng)實(shí)現(xiàn)重復(fù)數(shù)據(jù)刪除
◆ 動(dòng)態(tài)再平衡現(xiàn)有集群
◆ 通過把數(shù)據(jù)復(fù)制到多個(gè)集群?jiǎn)卧椭С挚焖偈∞D(zhuǎn)移來(lái)提供系統(tǒng)的高可用性。
MongoDB
MongoDB是一個(gè)介于關(guān)系數(shù)據(jù)庫(kù)和非關(guān)系數(shù)據(jù)庫(kù)之間的產(chǎn)品,是非關(guān)系數(shù)據(jù)庫(kù)當(dāng)中功能最豐富,最像關(guān)系數(shù)據(jù)庫(kù)的。他支持的數(shù)據(jù)結(jié)構(gòu)非常松散,是類似json的bjson格式,因此可以存儲(chǔ)比較復(fù)雜的數(shù)據(jù)類型。Mongo最大的特點(diǎn)是他支持的查詢語(yǔ)言非常強(qiáng)大,其語(yǔ)法有點(diǎn)類似于面向?qū)ο蟮牟樵冋Z(yǔ)言,幾乎可以實(shí)現(xiàn)類似關(guān)系數(shù)據(jù)庫(kù)單表查詢的絕大部分功能,而且還支持對(duì)數(shù)據(jù)建立索引。它的特點(diǎn)是高性能、易部署、易使用,存儲(chǔ)數(shù)據(jù)非常方便。
主要功能特性:
◆ 面向集合存儲(chǔ),易存儲(chǔ)對(duì)象類型的數(shù)據(jù)
“面向集合”(Collenction-Oriented),意思是數(shù)據(jù)被分組存儲(chǔ)在數(shù)據(jù)集中,被稱為一個(gè)集合(Collenction)。每個(gè) 集合在數(shù)據(jù)庫(kù)中都有一個(gè)唯一的標(biāo)識(shí)名,并且可以包含無(wú)限數(shù)目的文檔。集合的概念類似關(guān)系型數(shù)據(jù)庫(kù)(RDBMS)里的表(table),不同的是它不需要定 義任何模式(schema)。
◆ 模式自由
模式自由(schema-free),意味著對(duì)于存儲(chǔ)在mongodb數(shù)據(jù)庫(kù)中的文件,我們不需要知道它的任何結(jié)構(gòu)定義。如果需要的話,你完全可以把不同結(jié)構(gòu)的文件存儲(chǔ)在同一個(gè)數(shù)據(jù)庫(kù)里。
◆支持動(dòng)態(tài)查詢
◆支持完全索引,包含內(nèi)部對(duì)象
◆支持查詢
◆支持復(fù)制和故障恢復(fù)
◆使用高效的二進(jìn)制數(shù)據(jù)存儲(chǔ),包括大型對(duì)象(如視頻等)
◆自動(dòng)處理碎片,以支持云計(jì)算層次的擴(kuò)展性
◆支持RUBY,PYTHON,JAVA,C++,PHP等多種語(yǔ)言
◆文件存儲(chǔ)格式為BSON(一種JSON的擴(kuò)展)
BSON(Binary Serialized document Format)存儲(chǔ)形式是指:存儲(chǔ)在集合中的文檔,被存儲(chǔ)為鍵-值對(duì)的形式。鍵用于唯一標(biāo)識(shí)一個(gè)文檔,為字符串類型,而值則可以是各種復(fù)雜的文件類型。
◆可通過網(wǎng)絡(luò)訪問
MongoDB服務(wù)端可運(yùn)行在Linux、Windows或OS X平臺(tái),支持32位和64位應(yīng)用,默認(rèn)端口為27017。推薦運(yùn)行在64位平臺(tái),因?yàn)镸ongoDB在32位模式運(yùn)行時(shí)支持的最大文件尺寸為2GB。
MongoDB把數(shù)據(jù)存儲(chǔ)在文件中(默認(rèn)路徑為:/data/db),為提高效率使用內(nèi)存映射文件進(jìn)行管理。
Hypertable
Hypertable是一個(gè)開源、高性能、可伸縮的數(shù)據(jù)庫(kù),它采用與Google的Bigtable相似的模型。在過去數(shù)年中,Google為在PC集群 上運(yùn)行的可伸縮計(jì)算基礎(chǔ)設(shè)施設(shè)計(jì)建造了三個(gè)關(guān)鍵部分。第一個(gè)關(guān)鍵的基礎(chǔ)設(shè)施是Google File System(GFS),這是一個(gè)高可用的文件系統(tǒng),提供了一個(gè)全局的命名空間。它通過跨機(jī)器(和跨機(jī)架)的文件數(shù)據(jù)復(fù)制來(lái)達(dá)到高可用性,并因此免受傳統(tǒng) 文件存儲(chǔ)系統(tǒng)無(wú)法避免的許多失敗的影響,比如電源、內(nèi)存和網(wǎng)絡(luò)端口等失敗。第二個(gè)基礎(chǔ)設(shè)施是名為Map-Reduce的計(jì)算框架,它與GFS緊密協(xié)作,幫 助處理收集到的海量數(shù)據(jù)。第三個(gè)基礎(chǔ)設(shè)施是Bigtable,它是傳統(tǒng)數(shù)據(jù)庫(kù)的替代。Bigtable讓你可以通過一些主鍵來(lái)組織海量數(shù)據(jù),并實(shí)現(xiàn)高效的 查詢。Hypertable是Bigtable的一個(gè)開源實(shí)現(xiàn),并且根據(jù)我們的想法進(jìn)行了一些改進(jìn)。
Apache Cassandra
Apache Cassandra是一套開源分布式Key-Value存儲(chǔ)系統(tǒng)。它最初由Facebook開發(fā),用于儲(chǔ)存特別大的數(shù)據(jù)。Facebook在使用此系統(tǒng)。
主要特性:
◆ 分布式
◆ 基于column的結(jié)構(gòu)化
◆ 高伸展性
Cassandra的主要特點(diǎn)就是它不是一個(gè)數(shù)據(jù)庫(kù),而是由一堆數(shù)據(jù)庫(kù)節(jié)點(diǎn)共同構(gòu)成的一個(gè)分布式網(wǎng)絡(luò)服務(wù),對(duì)Cassandra 的一個(gè)寫操作,會(huì)被復(fù)制到其他節(jié)點(diǎn)上去,對(duì)Cassandra的讀操作,也會(huì)被路由到某個(gè)節(jié)點(diǎn)上面去讀取。對(duì)于一個(gè)Cassandra群集來(lái)說,擴(kuò)展性能 是比較簡(jiǎn)單的事情,只管在群集里面添加節(jié)點(diǎn)就可以了。
Cassandra是一個(gè)混合型的非關(guān)系的數(shù)據(jù)庫(kù),類似于Google的BigTable。其主要功能比 Dynomite(分布式的Key-Value存 儲(chǔ)系統(tǒng))更豐富,但支持度卻不如文檔存儲(chǔ)MongoDB(介于關(guān)系數(shù)據(jù)庫(kù)和非關(guān)系數(shù)據(jù)庫(kù)之間的開源產(chǎn)品,是非關(guān)系數(shù)據(jù)庫(kù)當(dāng)中功能最豐富,最像關(guān)系數(shù)據(jù)庫(kù) 的。Cassandra最初由Facebook開發(fā),后轉(zhuǎn)變成了開源項(xiàng)目。它是一個(gè)網(wǎng)絡(luò)社交云計(jì)算方面理想的數(shù)據(jù)庫(kù)。以Amazon專有的完全分布式的Dynamo為基礎(chǔ),結(jié)合了Google BigTable基于列族(Column Family)的數(shù)據(jù)模型。P2P去中心化的存儲(chǔ)。很多方面都可以稱之為Dynamo 2.0。
CouchDB
所用語(yǔ)言: Erlang
特點(diǎn):DB一致性,易于使用
使用許可: Apache
協(xié)議: HTTP/REST
雙向數(shù)據(jù)復(fù)制,持續(xù)進(jìn)行或臨時(shí)處理,處理時(shí)帶沖突檢查,因此,采用的是master-master復(fù)制
MVCC – 寫操作不阻塞讀操作
可保存文件之前的版本
Crash-only(可靠的)設(shè)計(jì)
需要不時(shí)地進(jìn)行數(shù)據(jù)壓縮
視圖:嵌入式 映射/減少
格式化視圖:列表顯示
支持進(jìn)行服務(wù)器端文檔驗(yàn)證
支持認(rèn)證
根據(jù)變化實(shí)時(shí)更新
支持附件處理
因此, CouchApps(獨(dú)立的 js應(yīng)用程序)
需要 jQuery程序庫(kù)
最佳應(yīng)用場(chǎng)景:適用于數(shù)據(jù)變化較少,執(zhí)行預(yù)定義查詢,進(jìn)行數(shù)據(jù)統(tǒng)計(jì)的應(yīng)用程序。適用于需要提供數(shù)據(jù)版本支持的應(yīng)用程序。
例如:CRM、CMS系統(tǒng)。 master-master復(fù)制對(duì)于多站點(diǎn)部署是非常有用的。
和其他數(shù)據(jù)庫(kù)比較,其突出特點(diǎn)是:
◆ 模式靈活 :使用Cassandra,像文檔存儲(chǔ),你不必提前解決記錄中的字段。你可以在系統(tǒng)運(yùn)行時(shí)隨意的添加或移除字段。這是一個(gè)驚人的效率提升,特別是在大型部 署上。
◆ 真正的可擴(kuò)展性 :Cassandra是純粹意義上的水平擴(kuò)展。為給集群添加更多容量,可以指向另一臺(tái)電腦。你不必重啟任何進(jìn)程,改變應(yīng)用查詢,或手動(dòng)遷移任何數(shù)據(jù)。
◆ 多數(shù)據(jù)中心識(shí)別 :你可以調(diào)整你的節(jié)點(diǎn)布局來(lái)避免某一個(gè)數(shù)據(jù)中心起火,一個(gè)備用的數(shù)據(jù)中心將至少有每條記錄的完全復(fù)制。
◆ 范圍查詢 :如果你不喜歡全部的鍵值查詢,則可以設(shè)置鍵的范圍來(lái)查詢。
◆ 列表數(shù)據(jù)結(jié)構(gòu) :在混合模式可以將超級(jí)列添加到5維。對(duì)于每個(gè)用戶的索引,這是非常方便的。
◆ 分布式寫操作 :有可以在任何地方任何時(shí)間集中讀或?qū)懭魏螖?shù)據(jù)。并且不會(huì)有任何單點(diǎn)失敗。
NoSQL,指的是非關(guān)系型的數(shù)據(jù)庫(kù)。
NoSQL 是Not Only SQL 的縮寫,意思是“不僅僅是 SQL”,而不是“不使用 SQL”。
NoSQL 的出現(xiàn)可以解決傳統(tǒng)關(guān)系型數(shù)據(jù)庫(kù)所不能解決的問題。
1 理解ACID與BASE的區(qū)別(ACID是關(guān)系型數(shù)據(jù)庫(kù)強(qiáng)一致性的四個(gè)要求,而BASE是NoSQL數(shù)據(jù)庫(kù)通常對(duì)可用性及一致性的弱要求原則,它們的意思分別是,ACID:atomicity, consistency, isolation, durability;BASE:Basically Available, Soft-state, Eventually Consistent。同時(shí)有意思的是ACID在英語(yǔ)里意為酸,BASE意思為堿)
2 理解持久化與非持久化的區(qū)別。這么說是因?yàn)橛械腘oSQL系統(tǒng)是純內(nèi)存存儲(chǔ)的。
3 你必須意識(shí)到傳統(tǒng)有關(guān)系型數(shù)據(jù)庫(kù)與NoSQL系統(tǒng)在數(shù)據(jù)結(jié)構(gòu)上的本質(zhì)區(qū)別。傳統(tǒng)關(guān)系型數(shù)據(jù)庫(kù)通常是基于行的表格型存儲(chǔ),而NoSQL系統(tǒng)包括了列式存儲(chǔ)(Cassandra)、key/value存儲(chǔ)(Memcached)、文檔型存儲(chǔ)(CouchDB)以及圖結(jié)構(gòu)存儲(chǔ)(Neo4j)
4與傳統(tǒng)關(guān)系數(shù)據(jù)庫(kù)有統(tǒng)一的SQL語(yǔ)言操作接口不同,NoSQL系統(tǒng)通常有自己特有的API接口。
5 在架構(gòu)上,你必須搞清楚,NoSQL系統(tǒng)是被設(shè)計(jì)用于成百上千臺(tái)機(jī)器的集群中的,而非共享型數(shù)據(jù)庫(kù)系統(tǒng)的架構(gòu)。
6在NoSQL系統(tǒng)中,可能你得習(xí)慣一下不知道你的數(shù)據(jù)具體存在何處的情況。
7 在NoSQL系統(tǒng)中,你最好習(xí)慣它的弱一致性?!眅ventually consistent”(最終一致性)正是BASE原則中的重要一項(xiàng)。比如在Twitter,你在Followers列表中經(jīng)常會(huì)感受到數(shù)據(jù)的延遲。
8 在NoSQL系統(tǒng)中,你要理解,很多時(shí)候數(shù)據(jù)并不總是可用的。
9 你得理解,有的方案是擁有分區(qū)容忍性的,有的方案不一定有。