本篇內(nèi)容介紹了“分布式緩存能不能被用作NoSQL數(shù)據(jù)庫”的有關(guān)知識,在實際案例的操作過程中,不少人都會遇到這樣的困境,接下來就讓小編帶領(lǐng)大家學(xué)習(xí)一下如何處理這些情況吧!希望大家仔細(xì)閱讀,能夠?qū)W有所成!
我們提供的服務(wù)有:做網(wǎng)站、成都網(wǎng)站建設(shè)、微信公眾號開發(fā)、網(wǎng)站優(yōu)化、網(wǎng)站認(rèn)證、鳳岡ssl等。為上千余家企事業(yè)單位解決了網(wǎng)站和推廣的問題。提供周到的售前咨詢和貼心的售后服務(wù),是有科學(xué)管理、有技術(shù)的鳳岡網(wǎng)站制作公司分布式緩存能被用作NoSQL數(shù)據(jù)庫嗎
InfoQ:你能否就分布式緩存解決方案與NoSQL數(shù)據(jù)庫做個對比?
Greg Luck:分布式緩存通常會把數(shù)據(jù)放在內(nèi)存里,用于降低延時。NoSQL數(shù)據(jù)庫是沒有R的DBMS(即沒有關(guān)系的數(shù)據(jù)庫管理系統(tǒng)),一般也缺乏對事務(wù)和其他高級特性的支持。對于不支持關(guān)系的系統(tǒng),表關(guān)系的關(guān)聯(lián)是SQL里最麻煩的部分,這也正是NoSQL這個名字的起源。
其中一種NoSQL數(shù)據(jù)庫是鍵值存儲。典型的例子包括Dynamo、Oracle NoSQL Database和Redis。緩存也是鍵值存儲,因此說這兩者是相關(guān)的。很多緩存實現(xiàn)能被配置為可持久化的,之所以很多時候不那么做,是因為緩存是要提升性能而不是做持久化。而NoSQL數(shù)據(jù)庫則與此相反,它是用來做持久化的。
持久化緩存也可當(dāng)作鍵值NoSQL數(shù)據(jù)庫來使用。NoSQL也提到了Big Data,通常是指比能放進(jìn)一個單獨的RDBMS節(jié)點的量要大的數(shù)據(jù),一般從幾TB到幾PB。
分布式緩存通常用于降低事務(wù)性數(shù)據(jù)的延時,這些數(shù)據(jù)開始時并不大,但慢慢就會往Big Data這個方向發(fā)展。由于緩存將數(shù)據(jù)保存在內(nèi)存里,這提高了存儲的成本,而且需要限制數(shù)據(jù)的大小。如果依賴于堆存儲,每個服務(wù)器節(jié)點可能只有可憐的2GB。如果依賴于分布式緩存,Ehcache還提供了堆外存儲,每臺服務(wù)器可以存儲幾百GB數(shù)據(jù),可以用作TB級別的緩存。
持久化、分布式的緩存可以適用于一些NoSQL的場景。NoSQL數(shù)據(jù)庫也可以應(yīng)對一些緩存的場景,只是延時稍高而已。
InfoQ:從架構(gòu)角度來看,分布式緩存和NoSQL數(shù)據(jù)庫有什么相似之處嗎?
Greg:它們都想提供優(yōu)于RDBMS的TPS和可擴展性。為此,它們都在功能上做了簡化,拋開了那些麻煩的問題,比如表關(guān)聯(lián)、存儲過程和ACID事務(wù)。
雖然Java緩存領(lǐng)域里有JSR 107,它為Spring和Java EE程序員提供了一套標(biāo)準(zhǔn)的緩存API,但是比起標(biāo)準(zhǔn)化接口,它們都更傾向于使用私有接口。
它們都采用對客戶端透明的方式對數(shù)據(jù)進(jìn)行分區(qū),做向外擴展。非Java產(chǎn)品向上擴展做得也很好。擁有Terracotta BigMemory,我們在Java平臺上的向上擴展方面也做得很特別。最后,兩者都可以部署在常見的硬件和操作系統(tǒng)上,這讓它們都能理想地運行于云端。
InfoQ:架構(gòu)上這兩項技術(shù)又有何不同呢?
Greg:NoSQL和RDBMS通常使用的是磁盤。磁盤是機械設(shè)備,延時很厲害,因為尋道時間是磁頭移動到正確的磁道的時間,讀寫時間依賴于磁盤的RPM。NoSQL嘗試優(yōu)化磁盤的使用,例如,僅僅在磁頭當(dāng)前位置追加日志,偶爾才刷新到磁盤上。相反,緩存主要都把數(shù)據(jù)放內(nèi)存里。
NoSQL和RDBMS的客戶端很薄(想想Thrift或JDBC),只是在網(wǎng)絡(luò)中傳輸數(shù)據(jù),而像Ehcache這樣的緩存使用進(jìn)程內(nèi)存儲和遠(yuǎn)程存儲,因此常用請求在本地就能被成功處理。在分布式緩存上下文中,每個應(yīng)用程序服務(wù)器的進(jìn)程內(nèi)存儲中都會緩存熱點數(shù)據(jù),增加服務(wù)器數(shù)量并不會增加網(wǎng)絡(luò)或后端的負(fù)載。
RDBMS專注于成為通用的SOR(System of Record)。NoSQ希望成為某類特定數(shù)據(jù)類型的SOR,比如鍵值對、文檔、稀疏表(寬表)或圖。緩存著眼于性能,一般會與RDBMS或NoSQL數(shù)據(jù)庫結(jié)合使用,數(shù)據(jù)類型就是SOR。往往緩存中會存儲Web服務(wù)調(diào)用的結(jié)果,業(yè)務(wù)對象的計算結(jié)果,這個結(jié)果可能需要成百SOR調(diào)用才能得到。
像Ehcache這樣的緩存部分運行在應(yīng)用程序的操作系統(tǒng)進(jìn)程里,部分運行在網(wǎng)絡(luò)那頭自己機器的進(jìn)程里。但也不是全部分布式緩存都這樣:memcache就是一個例子,所有的數(shù)據(jù)都跨網(wǎng)絡(luò)存儲。
InfoQ:哪類應(yīng)用程序最適合這種方式?
Greg:這還得從先前的問題說起,要將分布式緩存用于你現(xiàn)有的應(yīng)用程序,通常只需要很小的工作量,而NoSQL則需要做很多事,還有大的架構(gòu)變更。
因此適用分布式緩存的第一類應(yīng)用程序是現(xiàn)有系統(tǒng),特別是有以下需要的:
由于使用量或負(fù)載激增而需要向外擴展
為達(dá)到SLA而需要有更低的延時
為了將大型機這樣的昂貴基礎(chǔ)設(shè)施的使用減到最低
減少Web服務(wù)調(diào)用而帶來的費用
應(yīng)對極端負(fù)載高峰(比如黑色星期五一樣的促銷)
分布式緩存能被用作NoSQL數(shù)據(jù)庫嗎
InfoQ:這種方式有什么局限么?
Greg:緩存,置于內(nèi)存之中,在大小上有制約,它們的技術(shù)局限受限于有多少內(nèi)存給它們使用(下面還會具體展開說明)。
緩存,就算它提供持久化功能,也未必算的上作為SOR的上選。緩存故意回避了備份到磁盤和從中還原的復(fù)雜功能,盡管也有簡單的。RDMBS在過去30年里開發(fā)了豐富的備份、還原、遷移、報表和ETL特性。而NoSQL則介于兩者之間。
緩存提供了改變數(shù)據(jù)與訪問數(shù)據(jù)的編程API。NoSQL和RDBMS則提供了工具,可以執(zhí)行腳本化語言(比如SQL、UnSQL和Thrift)。
但關(guān)鍵一點是要記住緩存并不想成為你的SOR。它能輕松地與你的RDBMS和睦相處,為此它并不需要RDBMS所有用的復(fù)雜功能。
InfoQ:以后分布式緩存解決方案、NoSQL數(shù)據(jù)庫和傳統(tǒng)RDBMS互相協(xié)同工作,你有何看法?
Greg:速度大幅快于RDBMS,依賴于部署拓?fù)涞腘oSQL,還有數(shù)據(jù)訪問模式,分布式緩存可以位于這三者之間的任意位置。那些需要更低延時的人可以將緩存作為NoSQL的一個補充,就像現(xiàn)在對待RDBMS那樣。
稍有不同的是,在你想將RDBMS擴展到多個節(jié)點時,經(jīng)常會難于擴展,或者影響編程契約,或者受制于CAP做出權(quán)衡;而使用NoSQL,就算只使用一個節(jié)點,你也可以簡單地將其視為多節(jié)點安裝。如果是向上擴展就沒有這些問題。在RDBMS中,添加緩存是為了避免向外擴展會遇到的麻煩。通常緩存能解決系統(tǒng)的容量問題,你不用費太多力氣。因此當(dāng)需要向外擴展時,加入緩存吧。
對于NoSQL而言,內(nèi)建了向外擴展的能力,在需要低延時的時候使用緩存吧。
“分布式緩存能不能被用作NoSQL數(shù)據(jù)庫”的內(nèi)容就介紹到這里了,感謝大家的閱讀。如果想了解更多行業(yè)相關(guān)的知識可以關(guān)注創(chuàng)新互聯(lián)網(wǎng)站,小編將為大家輸出更多高質(zhì)量的實用文章!