ES完全勝任MongoDB能干的事情,而且還加上了檢索功能,你可以選擇分詞檢索或者把你存的整個文檔當(dāng)作一個詞,前者類似于搜索引擎,后者類似于數(shù)據(jù)庫,而且ES最擅長的就是用Facet和Agg做數(shù)據(jù)統(tǒng)計,當(dāng)不分詞時,可以結(jié)合Redis等把詞條映射為整形數(shù),查詢效率會非常高。而且數(shù)據(jù)分區(qū)更靈活,可以隨時以編碼的方式打開或關(guān)閉某部分?jǐn)?shù)據(jù)節(jié)點(diǎn)。一般來說,把ES以數(shù)據(jù)庫的模式存儲,合理使用查詢語法,都可以秒級返回,不管多大的數(shù)據(jù)量,當(dāng)然做統(tǒng)計肯定會慢一些。對有些特殊查詢注意一下就行了:比如用wildcard的 *keyword 模式就比 keyword*模式要慢很多,需要合理規(guī)劃自己的業(yè)務(wù)場景和數(shù)據(jù)的mapping映射方式。
創(chuàng)新互聯(lián)2013年開創(chuàng)至今,是專業(yè)互聯(lián)網(wǎng)技術(shù)服務(wù)公司,擁有項目成都做網(wǎng)站、網(wǎng)站設(shè)計、外貿(mào)營銷網(wǎng)站建設(shè)網(wǎng)站策劃,項目實(shí)施與項目整合能力。我們以讓每一個夢想脫穎而出為使命,1280元余慶做網(wǎng)站,已為上家服務(wù),為余慶各地企業(yè)和個人服務(wù),聯(lián)系電話:13518219792
關(guān)系數(shù)據(jù)庫經(jīng)過幾十年的發(fā)展,已經(jīng)非常成熟,但同時也存在不足:
表結(jié)構(gòu)是強(qiáng)約束的,業(yè)務(wù)變更時擴(kuò)充很麻煩。
如果對大數(shù)據(jù)量的表進(jìn)行統(tǒng)計運(yùn)算,I/O會很高,因為即使只針對某列進(jìn)行運(yùn)算,也需要將整行數(shù)據(jù)讀入內(nèi)存。
全文搜索只能使用 Like 進(jìn)行整表掃描,性能非常低。
針對這些不足,產(chǎn)生了不同的 NoSQL 解決方案,在某些場景下比關(guān)系數(shù)據(jù)庫更有優(yōu)勢,但同時也犧牲了某些特性,所以不能片面的迷信某種方案,應(yīng)將其作為 SQL 的有利補(bǔ)充。
NoSQL != No SQL,而是:
NoSQL = Not Only SQL
典型的 NoSQL 方案分為4類:
Redis 是典型,其 value 是具體的數(shù)據(jù)結(jié)構(gòu),包括 string, hash, list, set, sorted set, bitmap, hyperloglog,常被稱為數(shù)據(jù)結(jié)構(gòu)服務(wù)器。
以 list 為例:
LPOP key 是移除并返回隊列左邊的第一個元素。
如果用關(guān)系數(shù)據(jù)庫就比較麻煩了,需要操作:
Redis 的缺點(diǎn)主要體現(xiàn)在不支持完成的ACID事務(wù),只能保證隔離性和一致性,無法保證原子性和持久性。
最大的特點(diǎn)是 no-schema,無需在使用前定義字段,讀取一個不存在的字段也不會導(dǎo)致語法錯誤。
特點(diǎn):
以電商為例,不同商品的屬性差異很大,如冰箱和電腦,這種差異性在關(guān)系數(shù)據(jù)庫中會有很大的麻煩,而使用文檔數(shù)據(jù)庫則非常方便。
文檔數(shù)據(jù)庫的主要缺點(diǎn):
關(guān)系數(shù)據(jù)庫是按行來存儲的,列式數(shù)據(jù)庫是按照列來存儲數(shù)據(jù)。
按行存儲的優(yōu)勢:
在某些場景下,這些優(yōu)勢就成為劣勢了,例如,計算超重人員的數(shù)據(jù),只需要讀取體重這一列進(jìn)行統(tǒng)計即可,但行式存儲會將整行數(shù)據(jù)讀取到內(nèi)存中,很浪費(fèi)。
而列式存儲中,只需要讀取體重這列的數(shù)據(jù)即可,I/O 將大大減少。
除了節(jié)省I/O,列式存儲還有更高的壓縮比,可以節(jié)省存儲空間。普通行式數(shù)據(jù)庫的壓縮比在 3:1 到 5:1 左右,列式數(shù)據(jù)庫在 8:1 到 30:1,因為單個列的數(shù)據(jù)相似度更高。
列式存儲的隨機(jī)寫效率遠(yuǎn)低于行式存儲,因為行式存儲時同一行多個列都存儲在連續(xù)空間中,而列式存儲將不同列存儲在不連續(xù)的空間。
一般將列式存儲應(yīng)用在離線大數(shù)據(jù)分析統(tǒng)計場景,因為這時主要針對部分列進(jìn)行操作,而且數(shù)據(jù)寫入后無須更新。
關(guān)系數(shù)據(jù)庫通過索引進(jìn)行快速查詢,但在全文搜索的情景下,索引就不夠了,因為:
假設(shè)有一個交友網(wǎng)站,信息表如下:
需要匹配性別、地點(diǎn)、語言列。
需要匹配性別、地點(diǎn)、愛好列。
實(shí)際搜索中,各種排列組合非常多,關(guān)系數(shù)據(jù)庫很難支持。
全文搜索引擎是使用 倒排索引 技術(shù),建立單詞到文檔的索引,例如上面的表信息建立倒排索引:
所以特別適合根據(jù)關(guān)鍵詞來查詢文檔內(nèi)容。
上面介紹了幾種典型的NoSQL方案,及各自的適用場景和特點(diǎn),您可以根據(jù)實(shí)際需求進(jìn)行選擇。
1. 大型網(wǎng)站系統(tǒng)的特點(diǎn)
2. 大型網(wǎng)站架構(gòu)演化歷程
2.1. 初始階段架構(gòu)
問題:網(wǎng)站運(yùn)營初期,訪問用戶少,一臺服務(wù)器綽綽有余。
特征:應(yīng)用程序、數(shù)據(jù)庫、文件等所有的資源都在一臺服務(wù)器上。
描述:通常服務(wù)器操作系統(tǒng)使用 linux,應(yīng)用程序使用 PHP 開發(fā),然后部署在 Apache 上,數(shù)據(jù)庫使用 Mysql,通俗稱為 LAMP。匯集各種免費(fèi)開源軟件以及一臺廉價服務(wù)器就可以開始系統(tǒng)的發(fā)展之路了。
2.2. 應(yīng)用服務(wù)和數(shù)據(jù)服務(wù)分離
問題:越來越多的用戶訪問導(dǎo)致性能越來越差,越來越多的數(shù)據(jù)導(dǎo)致存儲空間不足,一臺服務(wù)器已不足以支撐。
特征:應(yīng)用服務(wù)器、數(shù)據(jù)庫服務(wù)器、文件服務(wù)器分別獨(dú)立部署。
描述:三臺服務(wù)器對性能要求各不相同:應(yīng)用服務(wù)器要處理大量業(yè)務(wù)邏輯,因此需要更快更強(qiáng)大的 CPU;數(shù)據(jù)庫服務(wù)器需要快速磁盤檢索和數(shù)據(jù)緩存,因此需要更快的硬盤和更大的內(nèi)存;文件服務(wù)器需要存儲大量文件,因此需要更大容量的硬盤。
2.3. 使用緩存改善性能
問題:隨著用戶逐漸增多,數(shù)據(jù)庫壓力太大導(dǎo)致訪問延遲。
特征:由于網(wǎng)站訪問和財富分配一樣遵循二八定律:80% 的業(yè)務(wù)訪問集中在 20% 的數(shù)據(jù)上。將數(shù)據(jù)庫中訪問較集中的少部分?jǐn)?shù)據(jù)緩存在內(nèi)存中,可以減少數(shù)據(jù)庫的訪問次數(shù),降低數(shù)據(jù)庫的訪問壓力。
描述:緩存分為兩種:應(yīng)用服務(wù)器上的本地緩存和分布式緩存服務(wù)器上的遠(yuǎn)程緩存,本地緩存訪問速度更快,但緩存數(shù)據(jù)量有限,同時存在與應(yīng)用程序爭用內(nèi)存的情況。分布式緩存可以采用集群方式,理論上可以做到不受內(nèi)存容量限制的緩存服務(wù)。
2.4. 使用應(yīng)用服務(wù)器集群
問題:使用緩存后,數(shù)據(jù)庫訪問壓力得到有效緩解。但是單一應(yīng)用服務(wù)器能夠處理的請求連接有限,在訪問高峰期,成為瓶頸。
特征:多臺服務(wù)器通過負(fù)載均衡同時向外部提供服務(wù),解決單一服務(wù)器處理能力和存儲空間不足的問題。
描述:使用集群是系統(tǒng)解決高并發(fā)、海量數(shù)據(jù)問題的常用手段。通過向集群中追加資源,提升系統(tǒng)的并發(fā)處理能力,使得服務(wù)器的負(fù)載壓力不再成為整個系統(tǒng)的瓶頸。
2.5. 數(shù)據(jù)庫讀寫分離
問題:網(wǎng)站使用緩存后,使絕大部分?jǐn)?shù)據(jù)讀操作訪問都可以不通過數(shù)據(jù)庫就能完成,但是仍有一部分讀操作和全部的寫操作需要訪問數(shù)據(jù)庫,在網(wǎng)站的用戶達(dá)到一定規(guī)模后,數(shù)據(jù)庫因為負(fù)載壓力過高而成為網(wǎng)站的瓶頸。
特征:目前大部分的主流數(shù)據(jù)庫都提供主從熱備功能,通過配置兩臺數(shù)據(jù)庫主從關(guān)系,可以將一臺數(shù)據(jù)庫服務(wù)器的數(shù)據(jù)更新同步到一臺服務(wù)器上。網(wǎng)站利用數(shù)據(jù)庫的主從熱備功能,實(shí)現(xiàn)數(shù)據(jù)庫讀寫分離,從而改善數(shù)據(jù)庫負(fù)載壓力。
描述:應(yīng)用服務(wù)器在寫操作的時候,訪問主數(shù)據(jù)庫,主數(shù)據(jù)庫通過主從復(fù)制機(jī)制將數(shù)據(jù)更新同步到從數(shù)據(jù)庫。這樣當(dāng)應(yīng)用服務(wù)器在讀操作的時候,訪問從數(shù)據(jù)庫獲得數(shù)據(jù)。為了便于應(yīng)用程序訪問讀寫分離后的數(shù)據(jù)庫,通常在應(yīng)用服務(wù)器端使用專門的數(shù)據(jù)訪問模塊,使數(shù)據(jù)庫讀寫分離的對應(yīng)用透明。
2.6. 反向代理和 CDN 加速
問題:中國網(wǎng)絡(luò)環(huán)境復(fù)雜,不同地區(qū)的用戶訪問網(wǎng)站時,速度差別也極大。
特征:采用 CDN 和反向代理加快系統(tǒng)的靜態(tài)資源訪問速度。
描述:CDN 和反向代理的基本原理都是緩存,區(qū)別在于 CDN 部署在網(wǎng)絡(luò)提供商的機(jī)房,使用戶在請求網(wǎng)站服務(wù)時,可以從距離自己最近的網(wǎng)絡(luò)提供商機(jī)房獲取數(shù)據(jù);而反向代理則部署在網(wǎng)站的中心機(jī)房,當(dāng)用戶請求到達(dá)中心機(jī)房后,首先訪問的服務(wù)器時反向代理服務(wù)器,如果反向代理服務(wù)器中緩存著用戶請求的資源,就將其直接返回給用戶。
2.7. 分布式文件系統(tǒng)和分布式數(shù)據(jù)庫
問題:隨著大型網(wǎng)站業(yè)務(wù)持續(xù)增長,數(shù)據(jù)庫經(jīng)過讀寫分離,從一臺服務(wù)器拆分為兩臺服務(wù)器,依然不能滿足需求。
特征:數(shù)據(jù)庫采用分布式數(shù)據(jù)庫,文件系統(tǒng)采用分布式文件系統(tǒng)。
描述:分布式數(shù)據(jù)庫是數(shù)據(jù)庫拆分的最后方法,只有在單表數(shù)據(jù)規(guī)模非常龐大的時候才使用。不到不得已時,更常用的數(shù)據(jù)庫拆分手段是業(yè)務(wù)分庫,將不同的業(yè)務(wù)數(shù)據(jù)庫部署在不同的物理服務(wù)器上。
2.8. 使用 NoSQL 和搜索引擎
問題:隨著網(wǎng)站業(yè)務(wù)越來越復(fù)雜,對數(shù)據(jù)存儲和檢索的需求也越來越復(fù)雜。
特征:系統(tǒng)引入 NoSQL 數(shù)據(jù)庫及搜索引擎。
描述:NoSQL 數(shù)據(jù)庫及搜索引擎對可伸縮的分布式特性具有更好的支持。應(yīng)用服務(wù)器通過統(tǒng)一數(shù)據(jù)訪問模塊訪問各種數(shù)據(jù),減輕應(yīng)用程序管理諸多數(shù)據(jù)源的麻煩。
2.9. 業(yè)務(wù)拆分
問題:大型網(wǎng)站的業(yè)務(wù)場景日益復(fù)雜,分為多個產(chǎn)品線。
特征:采用分而治之的手段將整個網(wǎng)站業(yè)務(wù)分成不同的產(chǎn)品線。系統(tǒng)上按照業(yè)務(wù)進(jìn)行拆分改造,應(yīng)用服務(wù)器按照業(yè)務(wù)區(qū)分進(jìn)行分別部署。
描述:應(yīng)用之間可以通過超鏈接建立關(guān)系,也可以通過消息隊列進(jìn)行數(shù)據(jù)分發(fā),當(dāng)然更多的還是通過訪問同一個數(shù)據(jù)存儲系統(tǒng)來構(gòu)成一個關(guān)聯(lián)的完整系統(tǒng)。
縱向拆分:將一個大應(yīng)用拆分為多個小應(yīng)用,如果新業(yè)務(wù)較為獨(dú)立,那么就直接將其設(shè)計部署為一個獨(dú)立的 Web 應(yīng)用系統(tǒng)??v向拆分相對較為簡單,通過梳理業(yè)務(wù),將較少相關(guān)的業(yè)務(wù)剝離即可。
橫向拆分:將復(fù)用的業(yè)務(wù)拆分出來,獨(dú)立部署為分布式服務(wù),新增業(yè)務(wù)只需要調(diào)用這些分布式服務(wù)橫向拆分需要識別可復(fù)用的業(yè)務(wù),設(shè)計服務(wù)接口,規(guī)范服務(wù)依賴關(guān)系。
2.10. 分布式服務(wù)
問題:隨著業(yè)務(wù)越拆越小,存儲系統(tǒng)越來越龐大,應(yīng)用系統(tǒng)整體復(fù)雜程度呈指數(shù)級上升,部署維護(hù)越來越困難。由于所有應(yīng)用要和所有數(shù)據(jù)庫系統(tǒng)連接,最終導(dǎo)致數(shù)據(jù)庫連接資源不足,拒絕服務(wù)。
特征:公共業(yè)務(wù)提取出來,獨(dú)立部署。由這些可復(fù)用的業(yè)務(wù)連接數(shù)據(jù)庫,通過分布式服務(wù)提供共用業(yè)務(wù)服務(wù)。
3. 大型網(wǎng)站架構(gòu)模式
3.1. 分層
大型網(wǎng)站架構(gòu)中常采用分層結(jié)構(gòu),將軟件系統(tǒng)分為應(yīng)用層、服務(wù)層、數(shù)據(jù)層:
分層架構(gòu)的約束:禁止跨層次的調(diào)用(應(yīng)用層直接調(diào)用數(shù)據(jù)層)及逆向調(diào)用(數(shù)據(jù)層調(diào)用服務(wù)層,或者服務(wù)層調(diào)用應(yīng)用層)。
分層結(jié)構(gòu)內(nèi)部還可以繼續(xù)分層,如應(yīng)用可以再細(xì)分為視圖層和業(yè)務(wù)邏輯層;服務(wù)層也可以細(xì)分為數(shù)據(jù)接口層和邏輯處理層。
3.2. 分割
將不同的功能和服務(wù)分割開來,包裝成高內(nèi)聚低耦合的模塊單元。這有助于軟件的開發(fā)和維護(hù),便于不同模塊的分布式部署,提高網(wǎng)站的并發(fā)處理能力和功能擴(kuò)展能力。
3.3. 分布式
大于大型網(wǎng)站,分層和分割的一個主要目的是為了切分后的模塊便于分布式部署,即將不同模塊部署在不同的服務(wù)器上,通過遠(yuǎn)程調(diào)用協(xié)同工作。
分布式意味可以用更多的機(jī)器工作,那么 CPU、內(nèi)存、存儲資源也就更豐富,能夠處理的并發(fā)訪問和數(shù)據(jù)量就越大,進(jìn)而能夠為更多的用戶提供服務(wù)。
分布式也引入了一些問題:
常用的分布式方案:
3.4. 集群
集群即多臺服務(wù)器部署相同應(yīng)用構(gòu)成一個集群,通過負(fù)載均衡設(shè)備共同對外提供服務(wù)。
集群需要具備伸縮性和故障轉(zhuǎn)移機(jī)制:伸縮性是指可以根據(jù)用戶訪問量向集群添加或減少機(jī)器;故障轉(zhuǎn)移是指,當(dāng)某臺機(jī)器出現(xiàn)故障時,負(fù)載均衡設(shè)備或失效轉(zhuǎn)移機(jī)制將請求轉(zhuǎn)發(fā)到集群中的其他機(jī)器上,從而不影響用戶使用。
3.5. 緩存
緩存就是將數(shù)據(jù)存放在距離最近的位置以加快處理速度。緩存是改善軟件性能的第一手段。
網(wǎng)站應(yīng)用中,緩存除了可以加快數(shù)據(jù)訪問速度以外,還可以減輕后端應(yīng)用和數(shù)據(jù)存儲的負(fù)載壓力。
常見緩存手段:
使用緩存有兩個前提:
3.6. 異步
軟件發(fā)展的一個重要目標(biāo)和驅(qū)動力是降低軟件耦合性。事物之間直接關(guān)系越少,彼此影響就越小,也就更容易獨(dú)立發(fā)展。
大型網(wǎng)站架構(gòu)中,系統(tǒng)解耦的手段除了分層、分割、分布式等,還有一個重要手段——異步。
業(yè)務(wù)間的消息傳遞不是同步調(diào)用,而是將一個業(yè)務(wù)操作拆分成多階段,每個階段間通過共享數(shù)據(jù)的方式異步執(zhí)行進(jìn)行協(xié)作。
異步架構(gòu)是典型的生產(chǎn)者消費(fèi)模式,二者不存在直接調(diào)用。異步消息隊列還有如下特性:
3.7. 冗余
大型網(wǎng)站,出現(xiàn)服務(wù)器宕機(jī)是必然事件。要保證部分服務(wù)器宕機(jī)的情況下網(wǎng)站依然可以繼續(xù)服務(wù),不丟失數(shù)據(jù),就需要一定程度的服務(wù)器冗余運(yùn)行,數(shù)據(jù)冗余備份。這樣當(dāng)某臺服務(wù)器宕機(jī)是,可以將其上的服務(wù)和數(shù)據(jù)訪問轉(zhuǎn)移到其他機(jī)器上。
訪問和負(fù)載很小的服務(wù)也必須部署 至少兩臺服務(wù)器構(gòu)成一個集群,目的就是通過冗余實(shí)現(xiàn)服務(wù)高可用。數(shù)據(jù)除了定期備份,存檔保存,實(shí)現(xiàn) 冷備份 外;為了保證在線業(yè)務(wù)高可用,還需要對數(shù)據(jù)庫進(jìn)行主從分離,實(shí)時同步實(shí)現(xiàn) 熱備份。
為了抵御地震、海嘯等不可抗因素導(dǎo)致的網(wǎng)站完全癱瘓,某些大型網(wǎng)站會對整個數(shù)據(jù)中心進(jìn)行備份,全球范圍內(nèi)部署 災(zāi)備數(shù)據(jù)中心。網(wǎng)站程序和數(shù)據(jù)實(shí)時同步到多個災(zāi)備數(shù)據(jù)中心。
3.8. 自動化
大型網(wǎng)站架構(gòu)的自動化架構(gòu)設(shè)計主要集中在發(fā)布運(yùn)維方面:
3.9. 安全
4. 大型網(wǎng)站核心架構(gòu)要素
架構(gòu) 的一種通俗說法是:最高層次的規(guī)劃,難以改變的決定。
4.1. 性能
性能問題無處不在,所以網(wǎng)站性能優(yōu)化手段也十分繁多:
4.2. 可用性
可用性指部分服務(wù)器出現(xiàn)故障時,還能否對用戶提供服務(wù)
4.3. 伸縮性
衡量伸縮的標(biāo)準(zhǔn)就是是否可以用多臺服務(wù)器構(gòu)建集群,是否容易向集群中增刪服務(wù)器節(jié)點(diǎn)。增刪服務(wù)器節(jié)點(diǎn)后是否可以提供和之前無差別的服務(wù)。集群中可容納的總服務(wù)器數(shù)是否有限制。
4.4. 擴(kuò)展性
衡量擴(kuò)展性的標(biāo)準(zhǔn)就是增加新的業(yè)務(wù)產(chǎn)品時,是否可以實(shí)現(xiàn)對現(xiàn)有產(chǎn)品透明無影響,不需要任何改動或很少改動,既有功能就可以上線新產(chǎn)品。主要手段有:事件驅(qū)動架構(gòu)和分布式服務(wù)。
4.5. 安全性
安全性保護(hù)網(wǎng)站不受惡意攻擊,保護(hù)網(wǎng)站重要數(shù)據(jù)不被竊取。
歡迎工作一到五年的Java工程師朋友們加入Java程序員開發(fā): 721575865
群內(nèi)提供免費(fèi)的Java架構(gòu)學(xué)習(xí)資料(里面有高可用、高并發(fā)、高性能及分布式、Jvm性能調(diào)優(yōu)、Spring源碼,MyBatis,Netty,Redis,Kafka,Mysql,Zookeeper,Tomcat,Docker,Dubbo,Nginx等多個知識點(diǎn)的架構(gòu)資料)合理利用自己每一分每一秒的時間來學(xué)習(xí)提升自己,不要再用"沒有時間“來掩飾自己思想上的懶惰!趁年輕,使勁拼,給未來的自己一個交代!
網(wǎng)頁中的數(shù)據(jù)大多數(shù)是存儲于數(shù)據(jù)庫中,知道庫連接、數(shù)據(jù)結(jié)構(gòu)和數(shù)據(jù)展示的網(wǎng)頁理論上是可以的。
但是程序設(shè)計中應(yīng)該是沒有設(shè)計存儲庫中數(shù)據(jù)對應(yīng)的網(wǎng)址,所以,你可能搜索到內(nèi)容,但是無法展示給客戶。(或者將搜索的結(jié)果在自己的網(wǎng)站中以一定的格式顯示)
對此,前Google工程師,Milo(本地商店搜索引擎)創(chuàng)始人Ted Dziuba最近發(fā)表標(biāo)題驚人的博客“I Can't Wait for NoSQL to Die”,對NoSQL的適用范圍進(jìn)行了分析。他認(rèn)為, NoSQL也會帶來一連串的新問題,并不會成為主流,無法取代關(guān)系型數(shù)據(jù)庫。 他的理由是:Cassandra等NoSQL數(shù)據(jù)庫在使用上并不方便,比如,修改column family定義時就需要重啟。而且NoSQL更適合Google那樣的規(guī)模,而一般的互聯(lián)網(wǎng)公司都不是Google,早早地去考慮Google那樣的規(guī)模的可擴(kuò)展性,純粹是浪費(fèi)時間,存在巨大的商業(yè)風(fēng)險。 他還透露,即使在Google,AdWords這樣的關(guān)鍵產(chǎn)品也是基于MySQL實(shí)現(xiàn)的。 他在文中最后表示,NoSQL當(dāng)然死不了,但是 它最終會被邊緣化,就像Rails被NoSQL邊緣化一樣 Dziuba的文章因為言辭激烈,在社區(qū)里引起了強(qiáng)烈反應(yīng)。 SQL數(shù)據(jù)庫陣營贊同者大有人在。craigslist工程師、著名的MySQL專家Jeremy Zawodny表示,在讀此文的時候,不時會心一笑。他說, NoSQL運(yùn)動只是軟件不斷進(jìn)化進(jìn)程中的正?,F(xiàn)象 。關(guān)系型數(shù)據(jù)庫也會繼續(xù)發(fā)展,MySQL社區(qū)不斷推出的XtraDB或InnoDB插件, PBXT, Drizzle都是證據(jù)。各種技術(shù)競爭的結(jié)果是,我們獲得了更多解決問題的選擇。 drizzle項目開發(fā)者Eric Day也表示,NoSQL有很多值得學(xué)習(xí)的,但是目前大部分實(shí)際項目的最佳選擇還是關(guān)系型數(shù)據(jù)庫。 NoSQL陣營當(dāng)然不會坐視不理,Cassandra項目組的Eric Evans表示,Dziuba提到Cassandra修改column family定義的問題其實(shí)很容易解決。而且,NoSQL并不是要取代MySQL,事實(shí)上Twitter仍然在用MySQL。如果關(guān)系型數(shù)據(jù)庫能夠承擔(dān)負(fù)荷,那就用好了;如果不行,請考慮NoSQL。 而德國知名博客Code Monkeyism則嘲笑Dziuba看起來并沒有用MySQL做過真實(shí)項目,因為MySQL如果沒有memcache,基本上無法應(yīng)付網(wǎng)站項目。他認(rèn)為,NoSQL將使SQL數(shù)據(jù)庫邊緣化,而且一個重要理由恰恰是可以節(jié)省DBA的開銷。 digg的前任首席架構(gòu)師現(xiàn)在也在創(chuàng)業(yè)的Joe Stump說,自己現(xiàn)在的創(chuàng)業(yè)項目就是用NoSQL,而且列舉了一系列問題挑戰(zhàn)SQL陣營。
淘寶技術(shù)架構(gòu)演進(jìn)
1、單機(jī)架構(gòu)
2、第一次演進(jìn):Tomcat與數(shù)據(jù)庫分開部署
3、第二次演進(jìn):引入本地緩存和分布式緩存
4、第三次演進(jìn):引入反向代理實(shí)現(xiàn)負(fù)載均衡
5、第四次演進(jìn):數(shù)據(jù)庫讀寫分離
6、第五次演進(jìn):數(shù)據(jù)庫按業(yè)務(wù)分庫
7、第六次演進(jìn):把大表拆分為小表
8、第七次演進(jìn):使用LVS或F5來使多個Nginx負(fù)載均衡
9、第八次演進(jìn):通過DNS輪詢實(shí)現(xiàn)機(jī)房間的負(fù)載均衡
10、第九次演進(jìn):引入NoSQL數(shù)據(jù)庫和搜索引擎等技術(shù)
11、第十次演進(jìn):大應(yīng)用拆分為小應(yīng)用
12、第十一次演進(jìn):復(fù)用的功能抽離成微服務(wù)
13、第十二次演進(jìn):引入企業(yè)服務(wù)總線ESB屏蔽服務(wù)接口的訪問差異
14、第十三次演進(jìn):引入容器化技術(shù)實(shí)現(xiàn)運(yùn)行環(huán)境隔離與動態(tài)服務(wù)管理
15、第十四次演進(jìn):以云平臺承載系統(tǒng)
所謂的云平臺,就是把海量機(jī)器資源,通過統(tǒng)一的資源管理,抽象為一個資源整體,在之上可按需動態(tài)申請硬件資源(如CPU、內(nèi)存、網(wǎng)絡(luò)等),并且之上提供通用的操作系統(tǒng),提供常用的技術(shù)組件(如Hadoop技術(shù)棧,MPP數(shù)據(jù)庫等)供用戶使用,甚至提供開發(fā)好的應(yīng)用,用戶不需要關(guān)系應(yīng)用內(nèi)部使用了什么技術(shù),就能夠解決需求(如音視頻轉(zhuǎn)碼服務(wù)、郵件服務(wù)、個人博客等)。在云平臺中會涉及如下幾個概念:
IaaS:基礎(chǔ)設(shè)施即服務(wù)。對應(yīng)于上面所說的機(jī)器資源統(tǒng)一為資源整體,可動態(tài)申請硬件資源的層面;
PaaS:平臺即服務(wù)。對應(yīng)于上面所說的提供常用的技術(shù)組件方便系統(tǒng)的開發(fā)和維護(hù);
SaaS:軟件即服務(wù)。對應(yīng)于上面所說的提供開發(fā)好的應(yīng)用或服務(wù),按功能或性能要求付費(fèi)。