本篇內(nèi)容介紹了“大表分庫分表總結(jié)”的有關(guān)知識,在實際案例的操作過程中,不少人都會遇到這樣的困境,接下來就讓小編帶領大家學習一下如何處理這些情況吧!希望大家仔細閱讀,能夠?qū)W有所成!
創(chuàng)新互聯(lián)公司長期為近1000家客戶提供的網(wǎng)站建設服務,團隊從業(yè)經(jīng)驗10年,關(guān)注不同地域、不同群體,并針對不同對象提供差異化的產(chǎn)品和服務;打造開放共贏平臺,與合作伙伴共同營造健康的互聯(lián)網(wǎng)生態(tài)環(huán)境。為平果企業(yè)提供專業(yè)的網(wǎng)站設計、成都網(wǎng)站制作,平果網(wǎng)站改版等技術(shù)服務。擁有十多年豐富建站經(jīng)驗和眾多成功案例,為您定制開發(fā)。
1.前言
為什么需要做分庫分表。這個相信大家多少都有所了解。
海量數(shù)據(jù)的存儲和訪問成為了MySQL數(shù)據(jù)庫的瓶頸問題,日益增長的業(yè)務數(shù)據(jù),無疑對MySQL數(shù)據(jù)庫造成了相當大的負載,同時對于系統(tǒng)的穩(wěn)定性和擴展性提出很高的要求。
而且單臺服務器的資源(CPU、磁盤、內(nèi)存等)總是有限的,最終數(shù)據(jù)庫所能承載的數(shù)據(jù)量、數(shù)據(jù)處理能力都將遭遇瓶頸。
目前來說一般有兩種方案。
1)一種是更換存儲,不使用MySQL,比如可以使用HBase、polarDB、TiDB等分布式存儲。
2)如果出于各種原因考慮,還是想繼續(xù)使用MySQL,一般會采用第二種方式,那就是分庫分表。
文章開頭就說了,網(wǎng)上分庫分表文章很多,對知識點講解比較多,因此,本文將不再過多贅述分庫分表方案的范式處理。
而是專注于梳理分庫分表從架構(gòu)設計 到 發(fā)布上線的完整過程,同時總結(jié)其中的注意事項和最佳實踐。包括五個部分:
業(yè)務重構(gòu)
存儲架構(gòu)設計
改造和上線
穩(wěn)定性保障
項目管理
尤其是各個階段的最佳實踐,都是血與淚凝聚的經(jīng)驗教訓。
2.第一階段:業(yè)務重構(gòu)(可選)
對于微服務劃分比較合理的分庫分表行為,一般只需要關(guān)注存儲架構(gòu)的變化,或者只需要在個別應用上進行業(yè)務改造即可,一般不需要著重考慮“業(yè)務重構(gòu)” 這一階段,因此,這一階段屬于“可選”。
本次項目的第一大難點,在于業(yè)務重構(gòu)。
而本次拆分項目涉及到的兩張大表A和B,單表將近八千萬的數(shù)據(jù),是從單體應用時代遺留下來的,從一開始就沒有很好的領域驅(qū)動/MSA架構(gòu)設計,邏輯發(fā)散非常嚴重,到現(xiàn)在已經(jīng)涉及50+個在線服務和20+個離線業(yè)務的的直接讀寫。
因此,如何保證業(yè)務改造的徹底性、全面性是重中之重,不能出現(xiàn)有遺漏的情況。
另外,表A 和 表B 各自有二、三十個字段,兩表的主鍵存在一一對應關(guān)系,因此,本次分庫分表項目中,還需要將兩個表進行重構(gòu)融合,將多余/無用的字段剔除。
2.1 查詢統(tǒng)計
在線業(yè)務通過分布式鏈路追蹤系統(tǒng)進行查詢,按照表名作為查詢條件,然后按照服務維度進行聚合,找到所有相關(guān)服務,寫一個文檔記錄相關(guān)團隊和服務。
這里特別注意下,很多表不是只有在線應用在使用,很多離線算法和數(shù)據(jù)分析的業(yè)務也在使用,這里需要一并的梳理好,做好線下跨團隊的溝通和調(diào)研工作,以免切換后影響正常的數(shù)據(jù)分析。
2.2 查詢拆分與遷移
創(chuàng)建一個jar包,根據(jù)2.1的統(tǒng)計結(jié)果,與服務owner合作將服務中的相關(guān)查詢都遷移到這個jar包中(本項目的jar包叫projected)。
此處為1.0.0-SNAPSHOT版本。
然后將原本服務內(nèi)的xxxMapper.xxxMethod( ) 全部改成projectdb.xxxMethod( )進行調(diào)用。
這樣做有兩個好處:
方便做后續(xù)的查詢拆分分析。
方便后續(xù)直接將jar包中的查詢替換為改造后 中臺服務 的rpc調(diào)用,業(yè)務方只需升級jar包版本,即可快速從sql調(diào)用改為rpc查詢。
這一步花了幾個月的實際,務必梳理各個服務做全面的遷移,不能遺漏,否則可能會導致拆分分析不全面,遺漏了相關(guān)字段。
查詢的遷移主要由于本次拆分項目涉及到的服務太多,需要收攏到一個jar包,更方便后期的改造。如果實際分庫分表項目中僅僅涉及一兩個服務的,這一步是可以不做的。
2.3 聯(lián)合查詢的拆分分析
根據(jù)2.2收攏的jar包中的查詢,結(jié)合實際情況將查詢進行分類和判斷,把一些歷史遺留的問題,和已經(jīng)廢棄的字段做一些整理。
以下舉一些思考點。
1)哪些查詢是無法拆分的?例如分頁(盡可能地改造,實在改不了只能以冗余列的形式)
2)哪些查詢是可以業(yè)務上join拆分的?
3)哪些表/字段是可以融合的?
4)哪些字段需要冗余?
5)哪些字段可以直接廢棄了?
6)根據(jù)業(yè)務具體場景和sql整體統(tǒng)計,識別關(guān)鍵的分表鍵。其余查詢走搜索平臺。
思考后得到一個查詢改造總體思路和方案。
同時在本項目中需要將兩張表融合為一張表,廢棄冗余字段和無效字段。
2.4 新表設計
這一步基于2.3對于查詢的拆分分析,得出舊表融合、冗余、廢棄字段的結(jié)果,設計新表的字段。
產(chǎn)出新表設計結(jié)構(gòu)后,必須發(fā)給各個相關(guān)業(yè)務方進行review,并保證所有業(yè)務方都通過該表的設計。有必要的話可以進行一次線下review。
如果新表的過程中,對部分字段進行了廢棄,必須通知所有業(yè)務方進行確認。
對于新表的設計,除了字段的梳理,也需要根據(jù)具體查詢,重新設計、優(yōu)化索引。
2.5 第一次升級
新表設計完成后,先做一次jar包內(nèi)sql查詢的改造,將舊的字段全部更新為新表的字段。
此處為2.0.0-SNAPSHOT版本。
然后讓所有服務升級jar包版本,以此來保證這些廢棄字段確實是不使用了,新的表結(jié)構(gòu)字段能夠完全覆蓋過去的業(yè)務場景。
特別注意的是,由于涉及服務眾多,可以將服務按照 非核心 與 核心 區(qū)分,然后分批次上線,避免出現(xiàn)問題導致嚴重故障或者大范圍回滾。
2.6 最佳實踐
2.6.1 盡量不改變原表的字段名稱
在做新表融合的時候,一開始只是簡單歸并表A 和 表B的表,因此很多字段名相同的字段做了重命名。
后來字段精簡過程中,刪除了很多重復字段,但是沒有將重命名的字段改回來。
導致后期上線的過程中,不可避免地需要業(yè)務方進行重構(gòu)字段名。
因此,新表設計的時候,除非必不得已,不要修改原表的字段名稱!
2.6.2 新表的索引需要仔細斟酌
新表的索引不能簡單照搬舊表,而是需要根據(jù)查詢拆分分析后,重新設計。
尤其是一些字段的融合后,可能可以歸并一些索引,或者設計一些更高性能的索引。
2.6 本章小結(jié)
至此,分庫分表的第一階段告一段落。這一階段所需時間,完全取決于具體業(yè)務,如果是一個歷史包袱沉重的業(yè)務,那可能需要花費幾個月甚至半年的時間才能完成。
這一階段的完成質(zhì)量非常重要,否則可能導致項目后期需要重建表結(jié)構(gòu)、重新全量數(shù)據(jù)。
這里再次說明,對于微服務劃分比較合理的服務,分庫分表行為一般只需要關(guān)注存儲架構(gòu)的變化,或者只需要在個別應用上進行業(yè)務改造即可,一般不需要著重考慮“業(yè)務重構(gòu)” 這一階段。
3.第二階段:存儲架構(gòu)設計(核心)
對于任何分庫分表的項目,存儲架構(gòu)的設計都是最核心的部分!
3.1 整體架構(gòu)
根據(jù)第一階段整理的查詢梳理結(jié)果,我們總結(jié)了這樣的查詢規(guī)律。
80%以上的查詢都是通過或者帶有字段pk1、字段pk2、字段pk3這三個維度進行查詢的,其中pk1和pk2由于歷史原因存在一一對應的關(guān)系
20%的查詢千奇百怪,包括模糊查詢、其他字段查詢等等
因此,我們設計了如下的整體架構(gòu),引入了數(shù)據(jù)庫中間件、數(shù)據(jù)同步工具、搜索引擎(阿里云opensearch/ES)等。
下文的論述都是圍繞這個架構(gòu)來展開的。
3.1.1 mysql分表存儲
Mysql分表的維度是根據(jù)查詢拆分分析的結(jié)果確定的。
我們發(fā)現(xiàn)pk1\pk2\pk3可以覆蓋80%以上的主要查詢。讓這些查詢根據(jù)分表鍵直接走mysql數(shù)據(jù)庫即可。
原則上一般最多維護一個分表的全量數(shù)據(jù),因為過多的全量數(shù)據(jù)會造成存儲的浪費、數(shù)據(jù)同步的額外開銷、更多的不穩(wěn)定性、不易擴展等問題。
但是由于本項目pk1和pk3的查詢語句都對實時性有比較高的要求,因此,維護了pk1和pk3作為分表鍵的兩份全量數(shù)據(jù)。
而pk2和pk1由于歷史原因,存在一一對應關(guān)系,可以僅保留一份映射表即可,只存儲pk1和pk2兩個字段。
3.1.2 搜索平臺索引存儲
搜索平臺索引,可以覆蓋剩余20%的零散查詢。
這些查詢往往不是根據(jù)分表鍵進行的,或者是帶有模糊查詢的要求。
對于搜索平臺來說,一般不存儲全量數(shù)據(jù)(尤其是一些大varchar字段),只存儲主鍵和查詢需要的索引字段,搜索得到結(jié)果后,根據(jù)主鍵去mysql存儲中拿到需要的記錄。
當然,從后期實踐結(jié)果來看,這里還是需要做一些權(quán)衡的:
1)有些非索引字段,如果不是很大,也可以冗余進來,類似覆蓋索引,避免多一次sql查詢;
2)如果表結(jié)構(gòu)比較簡單,字段不大,甚至可以考慮全量存儲,提高查詢性能,降低mysql數(shù)據(jù)庫的壓力。
這里特別提示,搜索引擎和數(shù)據(jù)庫之間同步是必然存在延遲的。所以對于根據(jù)分表id查詢的語句,盡量保證直接查詢數(shù)據(jù)庫,這樣不會帶來一致性問題的隱患。
3.1.3 數(shù)據(jù)同步
一般新表和舊表直接可以采用 數(shù)據(jù)同步 或者 雙寫的方式進行處理,兩種方式有各自的優(yōu)缺點。
一般根據(jù)具體情況選擇一種方式就行。
本次項目的具體同步關(guān)系見整體存儲架構(gòu),包括了四個部分:
1)舊表到新表全量主表的同步
一開始為了減少代碼入侵、方便擴展,采用了數(shù)據(jù)同步的方式。而且由于業(yè)務過多,擔心有未統(tǒng)計到的服務沒有及時改造,所以數(shù)據(jù)同步能避免這些情況導致數(shù)據(jù)丟失。
但是在上線過程中發(fā)現(xiàn),當延遲存在時,很多新寫入的記錄無法讀到,對具體業(yè)務場景造成了比較嚴重的影響。(具體原因參考4.5.1的說明)
因此,為了滿足應用對于實時性的要求,我們在數(shù)據(jù)同步的基礎上,重新在3.0.0-SNAPSHOT版本中改造成了雙寫的形式。
2)新表全量主表到全量副表的同步
3)新表全量主表到映射表到同步
4)新表全量主表到搜索引擎數(shù)據(jù)源的同步
2)、3)、4)都是從新表全量主表到其他數(shù)據(jù)源的數(shù)據(jù)同步,因為沒有強實時性的要求,因此,為了方便擴展,全部采用了數(shù)據(jù)同步的方式,沒有進行更多的多寫操作。
3.2 容量評估
在申請mysql存儲和搜索平臺索引資源前,需要進行容量評估,包括存儲容量和性能指標。
具體線上流量評估可以通過監(jiān)控系統(tǒng)查看qps,存儲容量可以簡單認為是線上各個表存儲容量的和。
但是在全量同步過程中,我們發(fā)現(xiàn)需要的實際容量的需求會大于預估,具體可以看3.4.6的說明。
具體性能壓測過程就不再贅述。
3.3 數(shù)據(jù)校驗
從上文可以看到,在本次項目中,存在大量的業(yè)務改造,屬于異構(gòu)遷移。
從過去的一些分庫分表項目來說,大多是同構(gòu)/對等拆分,因此不會存在很多復雜邏輯,所以對于數(shù)據(jù)遷移的校驗往往比較忽視。
在完全對等遷移的情況下,一般確實比較少出現(xiàn)問題。
但是,類似這樣有比較多改造的異構(gòu)遷移,校驗絕對是重中之重!!
因此,必須對數(shù)據(jù)同步的結(jié)果做校驗,保證業(yè)務邏輯改造正確、數(shù)據(jù)同步一致性正確。這一點非常非常重要。
在本次項目中,存在大量業(yè)務邏輯優(yōu)化以及字段變動,所以我們單獨做了一個校驗服務,對數(shù)據(jù)的全量、增量進行校驗。
過程中提前發(fā)現(xiàn)了許多數(shù)據(jù)同步、業(yè)務邏輯的不一致問題,給我們本次項目平穩(wěn)上線提供了最重要的前提保障!!
3.4 最佳實踐
3.4.1 分庫分表引起的流量放大問題
在做容量評估的時候,需要關(guān)注一個重要問題。就是分表帶來的查詢流量放大。
這個流量放大有兩方面的原因:
索引表的二次查詢。比如根據(jù)pk2查詢的,需要先通過pk2查詢pk1,然后根據(jù)pk1查詢返回結(jié)果。
in的分批查詢。如果一個select...in...的查詢,數(shù)據(jù)庫中間件會根據(jù)分表鍵,將查詢拆分落到對應的物理分表上,相當于原本的一次查詢,放大為多次查詢。(當然,數(shù)據(jù)庫會將落在同一個分表的id作為一次批量查詢,而這是不穩(wěn)定的合并)
因此,我們需要注意:
業(yè)務層面盡量限制in查詢數(shù)量,避免流量過于放大;
容量評估時,需要考慮這部分放大因素,做適當冗余,另外,后續(xù)會提到業(yè)務改造上線分批進行,保證可以及時擴容;
分64、128還是256張表有個合理預估,拆得越多,理論上會放大越多,因此不要無謂地分過多的表,根據(jù)業(yè)務規(guī)模做適當估計;
對于映射表的查詢,由于存在明顯的冷熱數(shù)據(jù),所以我們又在中間加了一層緩存,減少數(shù)據(jù)庫的壓力
3.4.2 分表鍵的變更方案
本項目中,存在一種業(yè)務情況會變更字段pk3,但是pk3作為分表鍵,在數(shù)據(jù)庫中間件中是不能修改的,因此,只能在中臺中修改對pk3的更新邏輯,采用先刪除、后添加的方式。
這里需要注意,刪除和添加操作的事務原子性。當然,簡單處理也可以通過日志的方式,進行告警和校準。
3.4.3 數(shù)據(jù)同步一致性問題
我們都知道,數(shù)據(jù)同步中一個關(guān)鍵點就是(消息)數(shù)據(jù)的順序性,如果不能保證接受的數(shù)據(jù)和產(chǎn)生的數(shù)據(jù)的順序嚴格一致,就有可能因為(消息)數(shù)據(jù)亂序帶來數(shù)據(jù)覆蓋,最終帶來不一致問題。
我們自研的數(shù)據(jù)同步工具底層使用的消息隊列是kakfa,,kafka對于消息的存儲,只能做到局部有序性(具體來說是每一個partition的有序)。我們可以把同一主鍵的消息路由至同一分區(qū),這樣一致性一般可以保證。但是,如果存在一對多的關(guān)系,就無法保證每一行變更有序,見如下例子。
那么需要通過反查數(shù)據(jù)源獲取最新數(shù)據(jù)保證一致性。
但是,反查也不是“銀彈“,需要考慮兩個問題。
1)如果消息變更來源于讀寫實例,而反查 數(shù)據(jù)庫是查只讀實例,那就會存在讀寫實例延遲導致的數(shù)據(jù)不一致問題。因此,需要保證 消息變更來源 和 反查數(shù)據(jù)庫 的實例是同一個。
2)反查對數(shù)據(jù)庫會帶來額外性能開銷,需要仔細評估全量時候的影響。
3.4.4 數(shù)據(jù)實時性問題
延遲主要需要注意幾方面的問題,并根據(jù)業(yè)務實際情況做評估和衡量。
1)數(shù)據(jù)同步平臺的秒級延遲
2)如果消息訂閱和反查數(shù)據(jù)庫都是落在只讀實例上,那么除了上述數(shù)據(jù)同步平臺的秒級延遲,還會有數(shù)據(jù)庫主從同步的延遲
3)寬表到搜索平臺的秒級延遲
只有能夠滿足業(yè)務場景的方案,才是合適的方案。
3.4.5 分表后存儲容量優(yōu)化
由于數(shù)據(jù)同步過程中,對于單表而言,不是嚴格按照遞增插入的,因此會產(chǎn)生很多”存儲空洞“,使得同步完后的存儲總量遠大于預估的容量。
因此,在新庫申請的時候,存儲容量多申請50%。
具體原因可以參考我的這篇文章 為什么MySQL分庫分表后總存儲大小變大了?
3.5 本章小結(jié)
至此,分庫分表的第二階段告一段落。
這一階段踩了非常多的坑。
一方面是設計高可用、易擴展的存儲架構(gòu)。在項目進展過程中,也做了多次的修改與討論,包括mysql數(shù)據(jù)冗余數(shù)量、搜索平臺的索引設計、流量放大、分表鍵修改等問題。
另一方面是“數(shù)據(jù)同步”本身是一個非常復雜的操作,正如本章最佳實踐中提及的實時性、一致性、一對多等問題,需要引起高度重視。
因此,更加依賴于數(shù)據(jù)校驗對最終業(yè)務邏輯正確、數(shù)據(jù)同步正確的檢驗!
在完成這一階段后,可以正式進入業(yè)務切換的階段。需要注意的是,數(shù)據(jù)校驗仍然會在下一階段發(fā)揮關(guān)鍵性作用。
4.第三階段:改造和上線(慎重)
前兩個階段完成后,開始業(yè)務切換流程,主要步驟如下:
1)中臺服務采用單讀 雙寫 的模式
2)舊表往新表開著數(shù)據(jù)同步
3) 所有服務升級依賴的projectDB版本,上線RPC,如果出現(xiàn)問題,降版本即可回滾(上線成功后,單讀新庫,雙寫新舊庫)
4)檢查監(jiān)控確保沒有 中臺服務 以外的其他服務訪問舊庫舊表
5)停止數(shù)據(jù)同步
6)刪除舊表
4.1 查詢改造
如何驗證我們前兩個階段設計是否合理?能否完全覆蓋查詢的修改 是一個前提條件。
當新表設計完畢后,就可以以新表為標準,修改老的查詢。
以本項目為例,需要將舊的sql在 新的中臺服務中 進行改造。
1)讀查詢的改造
可能查詢會涉及以下幾個方面:
a)根據(jù)查詢條件,需要將pk1和pk2的inner join改為對應分表鍵的新表表名
b)部分sql的廢棄字段處理
c)非分表鍵查詢改為走搜索平臺的查詢,注意保證語義一致
d)注意寫單測避免低級錯誤,主要是DAO層面。
只有新表結(jié)構(gòu)和存儲架構(gòu)能完全適應查詢改造,才能認為前面的設計暫時沒有問題。
當然,這里還有個前提條件,就是相關(guān)查詢已經(jīng)全部收攏,沒有遺漏。
2) 寫查詢的改造
除了相關(guān)字段的更改以外,更重要的是,需要改造為舊表、新表的雙寫模式。
這里可能涉及到具體業(yè)務寫入邏輯,本項目尤為復雜,需要改造過程中與業(yè)務方充分溝通,保證寫入邏輯正確。
可以在雙寫上各加一個配置開關(guān),方便切換。如果雙寫中發(fā)現(xiàn)新庫寫入有問題,可以快速關(guān)閉。
同時,雙寫過程中不關(guān)閉 舊庫到新庫 的數(shù)據(jù)同步。
為什么呢?主要還是由于我們項目的特殊性。由于我們涉及到幾十個服務,為了降低風險,必須分批上線。因此,存在比較麻煩的中間態(tài),一部分服務是老邏輯,一部分服務是新邏輯,必須保證中間態(tài)的數(shù)據(jù)正確性,具體見4.5.1的分析。
4.2 服務化改造
為什么需要新建一個 服務來 承載改造后的查詢呢?
一方面是為了改造能夠方便的升級與回滾切換,另一方面是為了將查詢收攏,作為一個中臺化的服務來提供相應的查詢能力。
將改造后的新的查詢放在服務中,然后jar包中的原本查詢,全部替換成這個服務的client調(diào)用。
同時,升級jar包版本到3.0.0-SNAPSHOT。
4.3 服務分批上線
為了降低風險,需要安排從非核心服務到核心服務的分批上線。
注意,分批上線過程中,由于寫服務往往是核心服務,所以安排在后面??赡艹霈F(xiàn)非核心的讀服務上線了,這時候會有讀新表、寫舊表的中間狀態(tài)。
1) 所有相關(guān)服務使用 重構(gòu)分支 升級projectdb版本到3.0.0-SNAPSHOT并部署內(nèi)網(wǎng)環(huán)境;
2) 業(yè)務服務依賴于 中臺服務,需要訂閱服務
3) 開重構(gòu)分支(不要與正常迭代分支合并),部署內(nèi)網(wǎng),內(nèi)網(wǎng)預計測試兩周以上
使用一個新的 重構(gòu)分支 是為了在內(nèi)網(wǎng)測試兩周的時候,不影響業(yè)務正常迭代。每周更新的業(yè)務分支可以merge到重構(gòu)分支上部署內(nèi)網(wǎng),然后外網(wǎng)使用業(yè)務分支merge到master上部署。
當然,如果從線上線下代碼分支一致的角度,也可以重構(gòu)分支和業(yè)務分支一起測試上線,對開發(fā)和測試的壓力會較大。
4)分批上線過程中,如果碰到依賴沖突的問題,需要及時解決并及時更新到該文檔中
5)服務上線前,必須要求業(yè)務開發(fā)或者測試,明確評估具體api和風險點,做好回歸。
這里再次提醒,上線完成后,請不要漏掉離線的數(shù)據(jù)分析業(yè)務!請不要漏掉離線的數(shù)據(jù)分析業(yè)務!請不要漏掉離線的數(shù)據(jù)分析業(yè)務!
4.4 舊表下線流程
1)檢查監(jiān)控確保沒有中臺服務以外的其他服務訪問舊庫舊表
2)檢查數(shù)據(jù)庫上的sql審計,確保沒有其他服務仍然讀取舊表數(shù)據(jù)
3)停止數(shù)據(jù)同步
4)刪除舊表
4.5 最佳實踐
4.5.1 寫完立即讀可能讀不到
在分批上線過程中,遇到了寫完立即讀可能讀不到的情況。由于業(yè)務眾多,我們采用了分批上線的方式降低風險,存在一部分應用已經(jīng)升級,一部分應用尚未升級的情況。未升級的服務仍然往舊表寫數(shù)據(jù),而升級后的應用會從新表讀數(shù)據(jù),當延遲存在時,很多新寫入的記錄無法讀到,對具體業(yè)務場景造成了比較嚴重的影響。
延遲的原因主要有兩個:
1)寫服務還沒有升級,還沒有開始雙寫,還是寫舊表,這時候會有讀新表、寫舊表的中間狀態(tài),新舊表存在同步延遲。
2)為了避免主庫壓力,新表數(shù)據(jù)是從舊表獲取變更、然后反查舊表只讀實例的數(shù)據(jù)進行同步的,主從庫本身存在一定延遲。
解決方案一般有兩種:
1)數(shù)據(jù)同步改為雙寫邏輯。
2)在讀接口做補償,如果新表查不到,到舊表再查一次。
4.5.2 數(shù)據(jù)庫中間件唯一ID替換自增主鍵(劃重點,敲黑板)
由于分表后,繼續(xù)使用單表的自增主鍵,會導致全局主鍵沖突。因此,需要使用分布式唯一ID來代替自增主鍵。各種算法網(wǎng)上比較多,本項目采用的是數(shù)據(jù)庫自增sequence生成方式。
數(shù)據(jù)庫自增sequence的分布式ID生成器,是一個依賴Mysql的存在, 它的基本原理是在Mysql中存入一個數(shù)值, 每有一臺機器去獲取ID的時候,都會在當前ID上累加一定的數(shù)量比如說2000, 然后把當前的值加上2000返回給服務器。這樣每一臺機器都可以繼續(xù)重復此操作獲得唯一id區(qū)間。
但是僅僅有全局唯一ID就大功告成了嗎?顯然不是,因為這里還會存在新舊表的id沖突問題。
因為服務比較多,為了降低風險需要分批上線。因此,存在一部分服務還是單寫舊表的邏輯,一部分服務是雙寫的邏輯。
這樣的狀態(tài)中,舊表的id策略使用的是auto_increment。如果只有單向數(shù)據(jù)來往的話(舊表到新表),只需要給舊表的id預留一個區(qū)間段,sequence從一個較大的起始值開始就能避免沖突。
但該項目中,還有新表數(shù)據(jù)和舊表數(shù)據(jù)的雙寫,如果采用上述方案,較大的id寫入到舊表,舊表的auto_increment將會被重置到該值,這樣單寫舊表的服務產(chǎn)生的遞增id的記錄必然會出現(xiàn)沖突。
所以這里交換了雙方的區(qū)間段,舊庫從較大的auto_increment起始值開始,新表選擇的id(也就是sequence的范圍)從大于舊表的最大記錄的id開始遞增,小于舊表auto_increment即將設置的起始值,很好的避免了id沖突問題。
1)切換前:
sequence的起始id設置為當前舊表的自增id大小,然后舊表的自增id需要改大,預留一段區(qū)間,給舊表的自增id繼續(xù)使用,防止未升級業(yè)務寫入舊表的數(shù)據(jù)同步到新庫后產(chǎn)生id沖突;
2)切換后
無需任何改造,斷開數(shù)據(jù)同步即可
3)優(yōu)點
只用一份代碼;
切換可以使用開關(guān)進行,不用升級改造;
如果萬一中途舊表的autoincrement被異常數(shù)據(jù)變大了,也不會造成什么問題。
4)缺點
如果舊表寫失敗了,新表寫成功了,需要日志輔助處理
4.6 本章小結(jié)
完成舊表下線后,整個分庫分表的改造就完成了。
在這個過程中,需要始終保持對線上業(yè)務的敬畏,仔細思考每個可能發(fā)生的問題,想好快速回滾方案(在三個階段提到了projectdb的jar包版本迭代,從1.0.0-SNAPSHOT到3.0.0-SNAPSHOT,包含了每個階段不同的變更,在不同階段的分批上線的過程中,通過jar包版本的方式進行回滾,發(fā)揮了巨大作用),避免造成重大故障。
5.穩(wěn)定性保障
這一章主要再次強調(diào)穩(wěn)定性的保障手段。作為本次項目的重要目標之一,穩(wěn)定性其實貫穿在整個項目周期內(nèi),基本上在上文各個環(huán)節(jié)都已經(jīng)都有提到,每一個環(huán)節(jié)都要引起足夠的重視,仔細設計和評估方案,做到心中有數(shù),而不是靠天吃飯:
1)新表設計必須跟業(yè)務方充分溝通、保證review。
2)對于“數(shù)據(jù)同步”,必須有數(shù)據(jù)校驗保障數(shù)據(jù)正確性,可能導致數(shù)據(jù)不正確的原因上文已經(jīng)提到來很多,包括實時性、一致性的問題。保證數(shù)據(jù)正確是上線的大前提。
3)每一階段的變動,都必須做好快速回滾都預案。
4)上線過程,都以分批上線的形式,從非核心業(yè)務開始做試點,避免故障擴大。
5)監(jiān)控告警要配置全面,出現(xiàn)問題及時收到告警,快速響應。不要忽略,很重要,有幾次出現(xiàn)過數(shù)據(jù)的問題,都是通過告警及時發(fā)現(xiàn)和解決的。6)單測,業(yè)務功能測試等要充分
6.項目管理之跨團隊協(xié)作
關(guān)于“跨團隊協(xié)作”,本文專門拎出來作為一章。
因為在這樣一個跨團隊的大型項目改造過程中,科學的團隊協(xié)作是保障整體項目按時、高質(zhì)量完成的不可缺少的因素。
下面,分享幾點心得與體會。
6.1 一切文檔先行
團隊協(xié)作最忌“空口無憑”。
無論是團隊分工、進度安排或是任何需要多人協(xié)作的事情,都需要有一個文檔記錄,用于追蹤進度,把控流程。
6.2 業(yè)務溝通與確認
所有的表結(jié)構(gòu)改造,必須跟相關(guān)業(yè)務方溝通,對于可能存在的歷史邏輯,進行全面梳理;
所有討論確定后的字段改造,必須由每個服務的Owner進行確認。
6.3 責任到位
對于多團隊多人次的合作項目,每個團隊都應該明確一個對接人,由項目總負責人與團隊唯一對接人溝通,明確團隊完整進度和完成質(zhì)量。
“大表分庫分表總結(jié)”的內(nèi)容就介紹到這里了,感謝大家的閱讀。如果想了解更多行業(yè)相關(guān)的知識可以關(guān)注創(chuàng)新互聯(lián)網(wǎng)站,小編將為大家輸出更多高質(zhì)量的實用文章!