本篇內(nèi)容介紹了“基于TableStore的海量電商訂單元數(shù)據(jù)管理分析”的有關(guān)知識,在實際案例的操作過程中,不少人都會遇到這樣的困境,接下來就讓小編帶領(lǐng)大家學習一下如何處理這些情況吧!希望大家仔細閱讀,能夠?qū)W有所成!
利辛ssl適用于網(wǎng)站、小程序/APP、API接口等需要進行數(shù)據(jù)傳輸應用場景,ssl證書未來市場廣闊!成為成都創(chuàng)新互聯(lián)的ssl證書銷售渠道,可以享受市場價格4-6折優(yōu)惠!如果有意向歡迎電話聯(lián)系或者加微信:028-86922220(備注:SSL證書合作)期待與您的合作!
訂單系統(tǒng)存在于各行各業(yè),如電商訂單、銀行流水、運營商話費賬單等,是一個非常廣泛、通用的系統(tǒng)。對于這類系統(tǒng),在過去十幾年發(fā)展中已經(jīng)形成了經(jīng)典的做法。但是隨著互聯(lián)網(wǎng)的發(fā)展,以及各企業(yè)對數(shù)據(jù)的重視,需要存儲和持久化的訂單量越來越大。數(shù)據(jù)的重視程度與數(shù)據(jù)規(guī)模的膨脹帶來了新的挑戰(zhàn),原有的系統(tǒng)是否還能繼續(xù)滿足需求成了焦點?
某電商平臺A,需要進行持久化所有平臺產(chǎn)生的訂單數(shù)據(jù)。同時,基于所有的訂單數(shù)據(jù),系統(tǒng)又需要向外提供面向多種角色:消費者、店家、平臺三類人群的多元化的查詢服務。消費者可以查詢自己的歷史訂單,商家可以統(tǒng)計熱銷產(chǎn)品,平臺也可以分析用戶行為、平臺交易規(guī)模等。主要查詢方式涵蓋訂單的多維度檢索,以及訂單數(shù)據(jù)的分析、統(tǒng)計等,例如:
面向消費者:【A消費者】*【近1年】*【產(chǎn)品名含'電腦'字段】訂單查詢;
面向店家:【B店家】*【近1個月】*【每個產(chǎn)品】銷售量排名;
......
在訂單場景中,技術(shù)上通常需要考慮的技術(shù)點,主要包含如下幾個方面:
查詢能力:需要具備豐富的查詢類型,如多維度、范圍、模糊查詢等,同時具備排序、統(tǒng)計等功能;
數(shù)據(jù)量:存儲海量數(shù)據(jù)的同時,滿足強一致、高可用、低成本等要求;
服務性能:應對高并發(fā)請求高并發(fā)的同時,保證低延遲;
應對訂單場景,電商通常會采用MySQL傳統(tǒng)方案。借助關(guān)系型數(shù)據(jù)庫強大的查詢能力,用戶可直接通過SQL語句實現(xiàn)訂單數(shù)據(jù)的多維度查詢、數(shù)據(jù)統(tǒng)計等。所謂數(shù)據(jù)膨脹,分為橫向、縱向兩種,橫向即不斷迭代引入的新字段維度,縱向即總的存儲數(shù)據(jù)量。在面對這兩種訂單數(shù)據(jù)膨脹上,單MySql方案逐漸變得吃力。 SQL + NOSQL的組合方案(以下稱:組合方案)便應運而生,借助兩個數(shù)據(jù)庫各自的優(yōu)勢分別解決不同場景各自的需求。但組合方案同樣也帶來了新的問題,組合方案犧牲空間成本,同時也增加了開發(fā)工作量與運維復雜度。在保證數(shù)據(jù)一致性上產(chǎn)生額外開銷。
下面讓我們看一下如下幾個常規(guī)方案:
MySql自身擁有強大的數(shù)據(jù)查詢、分析功能,基于MyQql創(chuàng)建訂單系統(tǒng),可以應對訂單數(shù)據(jù)多維查詢、統(tǒng)計場景。伴隨著訂單數(shù)據(jù)量的增加,用戶會采取分庫、分表方案應對,通過這種偽分布式方案,解決數(shù)據(jù)膨脹帶來的問題。但數(shù)據(jù)一旦達到瓶頸,便需要重新創(chuàng)建更大規(guī)模的分庫+數(shù)據(jù)的全量遷移,麻煩就會不斷出現(xiàn)。數(shù)據(jù)迭代、膨脹帶來的困擾,是MySql方案難于逾越的。僅僅依靠MySql的傳統(tǒng)訂單方案短板凸顯。
1、數(shù)據(jù)縱向(數(shù)據(jù)規(guī)模)膨脹:采用分庫分表方案,MySql在部署時需要預估分庫規(guī)模,數(shù)據(jù)量一旦達到上限后,重新部署并做數(shù)據(jù)全量遷移;
2、數(shù)據(jù)橫向(字段維度)膨脹:schema需預定義,迭代新增新字段變更復雜。而維度到達一定量后影響數(shù)據(jù)庫性能;
引入雙數(shù)據(jù)的方案應運而生,通過實時數(shù)據(jù)、歷史數(shù)據(jù)分存的方案,可以一定程度解決數(shù)據(jù)量膨脹問題。該方案將數(shù)據(jù)歸類成兩部分存儲:實時數(shù)據(jù)、歷史數(shù)據(jù)。同時通過數(shù)據(jù)同步服務,將過期數(shù)據(jù)同步至歷史數(shù)據(jù)。
1、實時訂單數(shù)據(jù)(例如:近3個月的訂單):將實時訂單存入MySql數(shù)據(jù)庫。實時訂單的總量膨脹的速度得到了限制,同時保證了實時數(shù)據(jù)的多維查詢、分析能力;
2、歷史訂單數(shù)據(jù)(例如:3個月以前的訂單):將歷史訂單數(shù)據(jù)存入HBase,借助于HBase這一分布式NoSql數(shù)據(jù)庫,有效應對了訂單數(shù)據(jù)膨脹困擾。也保證了歷史訂單數(shù)據(jù)的持久化;
但是,該方案犧牲了歷史訂單數(shù)據(jù)對用戶、商家、平臺的使用價值,假設(shè)了歷史數(shù)據(jù)的需求頻率極低。但是一旦有需求,便需要全表掃描,查詢速度慢、IO成本很高。而維護數(shù)據(jù)同步又帶來了數(shù)據(jù)一致性、同步運維成本飆升等難題;
組合方案還有MySql+Elasticsearch,該方案同樣是將數(shù)據(jù)分兩部分存儲,可以一定程度解決訂單索引維度增長問題。用戶自己維護數(shù)據(jù)同步服務,保證兩部分數(shù)據(jù)的一致性;
1、全量數(shù)據(jù):將全量的訂單數(shù)據(jù)存入MySql數(shù)據(jù)庫,訂單ID之外的數(shù)據(jù)整體存為一個字段。該全量數(shù)據(jù)作為持久化存儲,也用于非索引字段的反查;
2、查詢數(shù)據(jù):僅將需要檢索的字段存入Elasticsearch(基于Lucene分布式索引數(shù)據(jù)庫),借助于Elasticsearch的索引能力,提供可以應付維度膨脹的訂單數(shù)據(jù),然后必要時反查MySql獲取訂單完整信息;
該方案應付了數(shù)據(jù)維度膨脹帶來的困擾,但是隨著訂單量的不斷膨脹,MySql擴展性差的問題再次暴露出來。同時數(shù)據(jù)同步至Elasticsearch的方案,開發(fā)、運維成本很高,方案選擇也存在弊端。
能力分析 | MySql | HBase | Elasticsearch | TableStore |
---|---|---|---|---|
存儲方式 | 行存儲 | 列存儲 | 索引存儲 | 列存儲+索引存儲 |
擴展性 | 單機、擴展性差 | 水平擴展 | 水平擴展 | (自動)水平擴展 |
一致性 | 強一致性 | 強一致性、時序一致性 | 強一致性、時序一致性 | |
檢索 | 較弱的支持 | 不支持 | 支持 | 支持 |
數(shù)據(jù)量 | ~ 1T,~億行 | ~10 PB,~萬億行 | ~1 PB,~千億行 | ~10 PB,~萬億行 |
如果使用表格存儲(TableStore)研發(fā)的多元索引(SearchIndex)方案,則可以完美地解決以上問題。TableStore具有即開即用,按量收費等特點。多元索引隨時創(chuàng)建,是海量電商訂單元數(shù)據(jù)管理的優(yōu)質(zhì)方案。
TableStore作為阿里云提供的一款全托管、分布式NoSql型數(shù)據(jù)存儲服務,具有【海量數(shù)據(jù)存儲】、【熱點數(shù)據(jù)自動分片】、【海量數(shù)據(jù)多維檢索】等功能,天然地解決了訂單數(shù)據(jù)大爆炸這一挑戰(zhàn);
同時,SearchIndex功能在保證用戶數(shù)據(jù)高可用的基礎(chǔ)上,提供了數(shù)據(jù)多維度搜索、統(tǒng)計等能力。針對多種場景創(chuàng)建多種索引,實現(xiàn)多種模式的檢索。用戶可以僅在需要的時候創(chuàng)建、開通索引。由TableStore來保證數(shù)據(jù)同步的一致性,這極大的降低了用戶的方案設(shè)計、服務運維、代碼開發(fā)等工作量。
“基于TableStore的海量電商訂單元數(shù)據(jù)管理分析”的內(nèi)容就介紹到這里了,感謝大家的閱讀。如果想了解更多行業(yè)相關(guān)的知識可以關(guān)注創(chuàng)新互聯(lián)網(wǎng)站,小編將為大家輸出更多高質(zhì)量的實用文章!