真实的国产乱ⅩXXX66竹夫人,五月香六月婷婷激情综合,亚洲日本VA一区二区三区,亚洲精品一区二区三区麻豆

成都創(chuàng)新互聯(lián)網(wǎng)站制作重慶分公司

21世紀了還愚公移山?數(shù)據(jù)庫這么遷移更穩(wěn)定!-創(chuàng)新互聯(lián)

背景

創(chuàng)新互聯(lián)技術(shù)團隊10余年來致力于為客戶提供網(wǎng)站建設(shè)、網(wǎng)站設(shè)計、成都品牌網(wǎng)站建設(shè)、全網(wǎng)營銷推廣、搜索引擎SEO優(yōu)化等服務(wù)。經(jīng)過多年發(fā)展,公司擁有經(jīng)驗豐富的技術(shù)團隊,先后服務(wù)、推廣了數(shù)千家網(wǎng)站,包括各類中小企業(yè)、企事單位、高校等機構(gòu)單位。

在系統(tǒng)的快速迭代過程中,業(yè)務(wù)系統(tǒng)往往部署在同一個物理庫,沒有做核心數(shù)據(jù)和非核心數(shù)據(jù)的物理隔離。隨著數(shù)據(jù)量的擴大這種情況會帶來穩(wěn)定性的風險,如庫的慢sql,磁盤,IO等等都會相互整體影響,從而影響核心系統(tǒng)的業(yè)務(wù)穩(wěn)定性,因此需要將核心業(yè)務(wù)的業(yè)務(wù)表從原有庫里抽取出來,單獨到新庫里。而核心數(shù)據(jù)的遷移,涉及到的一個關(guān)鍵難點:如何平穩(wěn)及用戶無感知的遷移數(shù)據(jù),本文將結(jié)合閑魚商品庫遷移實踐,向大家展示如何解決這個難題的.

閑魚商品數(shù)據(jù)現(xiàn)狀

閑魚商品數(shù)據(jù)量XX億級別以上,采用分表分庫和讀寫分離的MYSQL數(shù)據(jù)庫集群來支撐線上查詢服務(wù),如下圖,通過TDDL[1]數(shù)據(jù)庫中間件進行高效統(tǒng)一管理??赡苡行┩瑢W會對分表分庫相關(guān)概念不了解,這里先簡單做些介紹。

21世紀了還愚公移山?數(shù)據(jù)庫這么遷移更穩(wěn)定!

01  分表分庫原理

本質(zhì)是數(shù)據(jù)庫的水平拆分問題,把一個數(shù)據(jù)庫切分成多個部分放到不同的數(shù)據(jù)庫(server)上,從而緩解單一數(shù)據(jù)庫的性能問題,下圖描述分表分庫的核心原理:

21世紀了還愚公移山?數(shù)據(jù)庫這么遷移更穩(wěn)定!
當然分表分庫也有負面影響,就是表結(jié)構(gòu)變更及相關(guān)管理相比單表麻煩,有一定風險,具體如何決擇,還是要根據(jù)實際情況來分析。

02   分表分庫下全局Sequence生成

分表分庫解決在線服務(wù)容量和性能問題,但是也帶來使用上的復雜度提升。靈活的配置路由規(guī)則和路由數(shù)據(jù)并提供簡單易用的封裝都是要考慮的,以便業(yè)務(wù)對此無感知。阿里開源中間件產(chǎn)品TDDL提供了解決方案,對應(yīng)阿里云上產(chǎn)品為:DRDS[2]。

TDDL關(guān)鍵原理不多做介紹,但是在數(shù)據(jù)庫遷移過程中主鍵沖突風險是故障重要風險點,這里簡要介紹下TDDL的全局唯一主鍵生成原理。

21世紀了還愚公移山?數(shù)據(jù)庫這么遷移更穩(wěn)定!
如上圖,TDDL Sequence是基于數(shù)據(jù)庫更新+內(nèi)存分配:每次操作批量分配id,分配id的數(shù)量就是sequence的內(nèi)步長,而原有id值就加上外部長值,后續(xù)的分配直接就在內(nèi)存里拿,這樣的優(yōu)勢:簡單高效 缺點:無法保證自增順序。

另外數(shù)據(jù)遷移過程中,在新庫中,為了保證跟原數(shù)據(jù)庫主鍵非沖突,需要設(shè)置一個躍遷比較大的主鍵,防止出現(xiàn)兩個庫中的主鍵沖突,這是后續(xù)遷移中要注意的關(guān)鍵點之一。

數(shù)據(jù)遷移方案

通過前文的簡單介紹,大家對閑魚商品庫現(xiàn)狀有了初步了解,下面將給大家介紹一下閑魚是如何做到穩(wěn)定遷移商品庫的。

01  核心思路

數(shù)據(jù)遷移核心思路抽象起來其實很簡單,即如何穩(wěn)定平滑遷移數(shù)據(jù),如下圖所示:

21世紀了還愚公移山?數(shù)據(jù)庫這么遷移更穩(wěn)定!

但圍繞這個過程細化下去,我們會遇到不少問題,如:
1、數(shù)據(jù)我們該如何遷移,是一次性?還是分階段?
2、如何校驗數(shù)據(jù)遷移過程的正確性?
3、我們業(yè)務(wù)改造有問題怎么辦?如何盡早發(fā)現(xiàn)?如何回滾?
4、我們的新庫性能如何?

帶著這些問題,我們進一下細化梳理遷移方案。

02  實現(xiàn)方案

21世紀了還愚公移山?數(shù)據(jù)庫這么遷移更穩(wěn)定!

如上圖所示,整個方案分為幾個部份:

1、系統(tǒng)改造,包括SQL改造,雙寫開關(guān),新庫sequence創(chuàng)建。

SQL改造:加載兩套TDDL數(shù)據(jù)源,一套是給老庫的,一套是給新庫的,并且生成兩套mybatis sql 模板。
雙寫開關(guān):設(shè)置好寫新庫,寫老庫的開關(guān),用于線上遷移過程中雙寫過程及遇到問題及時回滾。
sequence創(chuàng)建:遷移sequence表時,需要抬升新庫的sequence表中的值,用于防止主鍵沖突,并且需要按照主鍵消耗量評估一個安全值,這是非常重要的一個細節(jié),再次強調(diào)一下。

2穩(wěn)定性保障,遷庫是大事,改造過程中,穩(wěn)定性重中之重,主要有系統(tǒng)壓測,線上流量回放,故障演練。

系統(tǒng)壓測:主要針對新庫進行性能測,防止新庫有意外情況。
線上流量回放:Edsger W. Dijkstra說過如果調(diào)試程序是一種標準的可以鏟除BUG的流程,那么,編程就是把他們放進來的流程。通過引入線上數(shù)據(jù)在測試環(huán)境回放,可以盡可能的發(fā)現(xiàn)問題,保證改造后的穩(wěn)定性。
故障演練:通過注入一些人為故障,如寫新庫失敗,新庫邏輯有問題,及時的演練回滾策略。

3、數(shù)據(jù)遷移,主要利用阿里云數(shù)據(jù)傳輸服務(wù)DTS[3]的數(shù)據(jù)遷移能力,涉及到全量遷移、增量遷移、一致性校驗及反向任務(wù)。

全量遷移:數(shù)據(jù)遷移首要目標如何將歷史全量數(shù)據(jù)遷移到新庫中,我們的做法是指定一個時間點,再根據(jù)這個時間點查找每張源表的大及最小id,然后分別批量導到目標庫中,如圖:

21世紀了還愚公移山?數(shù)據(jù)庫這么遷移更穩(wěn)定!

*整個過程都是查詢在線庫的備庫,因此不影響在線業(yè)務(wù)的數(shù)據(jù)庫服務(wù)。

增量遷移:由于遷移過程中業(yè)務(wù)服務(wù)一直運行,因此全量遷移完全成,并且要將全量時間點后的數(shù)據(jù)追回來,這里核心原理是同步全量時間位點后binlog日志數(shù)據(jù)來保證數(shù)據(jù)一致性,需要注意的是增量時間需要前移一小斷時間(如5分鐘),其主要原因是全量遷移啟動的那刻會有時間差,需要增量前移來保證數(shù)據(jù)最終一致性,如下圖:

21世紀了還愚公移山?數(shù)據(jù)庫這么遷移更穩(wěn)定!

一致性校驗:通過全量及增量的遷移后,此時源庫跟目標的數(shù)據(jù)理論上是一致的,但實際上應(yīng)用在經(jīng)過功能測試,線上流量回放等階段,數(shù)據(jù)在這個過程中有可能會現(xiàn)不一致的情況,因此正式上線前,需要做數(shù)據(jù)一致性校驗,其原理是分批查詢源表(跟全量遷移的查詢方式類似),再跟目標庫進行比對,如圖所示:

21世紀了還愚公移山?數(shù)據(jù)庫這么遷移更穩(wěn)定!

反向任務(wù):遷移到新庫后,會有一線離線業(yè)務(wù)對老庫還有依賴,需要建立從新庫到老庫的回流任務(wù),原理跟增量遷移一樣,只是變更一下原庫及目標庫。

03  遷庫流程

到這里大家應(yīng)該對遷庫所涉及到點比較清楚了,但還有一個非常重要的事,即梳理整個遷庫步驟非常關(guān)鍵,通常會有兩種方案。

方案一:

21世紀了還愚公移山?數(shù)據(jù)庫這么遷移更穩(wěn)定!

1、DTS數(shù)據(jù)追平,即全量同步完成,開啟增量同步,并且延遲在秒級以內(nèi)。
2、上線前校驗,主要有線上流量回放、壓測、一致性校驗,故障演練。
3、線上開雙寫,線上同時寫新庫及老庫,這時需要關(guān)閉增量同步任務(wù),防止無效覆蓋。
4、線上校驗,執(zhí)行預(yù)先準備的測試腳本并結(jié)合一致性校驗工具,同時將讀流量慢慢切到新庫,驗證雙寫邏輯。
5、切換數(shù)據(jù)源,關(guān)閉雙寫并正式寫入新庫。
6、創(chuàng)建反向任務(wù),數(shù)據(jù)回流老庫。

方案二:

21世紀了還愚公移山?數(shù)據(jù)庫這么遷移更穩(wěn)定!
1、DTS數(shù)據(jù)追平,即全量同步完成,開啟增量同步,并且延遲在秒級以內(nèi)。
2、上線前校驗,主要有線上流量回放、壓測、一致性校驗,故障演練。
3、線上切開關(guān),寫新庫, 同時需要關(guān)閉增量同步任務(wù),防止無效覆蓋。
4、創(chuàng)建反向任務(wù),數(shù)據(jù)回流老庫。

方案優(yōu)缺點對比:

21世紀了還愚公移山?數(shù)據(jù)庫這么遷移更穩(wěn)定!

總結(jié)起來方案1遷移流程相對復雜,對遷移的控制力度更細,適合業(yè)務(wù)復雜,底層改造比較多,想精細化控制遷移步驟的場景,方案2遷移相對簡單,過程快速,適合業(yè)務(wù)流程相對簡單,可控,想快速切換的場景,具體選選擇哪個方案,同學們可以根據(jù)自身的業(yè)務(wù)情況做選擇。

這里考慮到閑魚商品業(yè)務(wù)復雜,底層改造較多,從穩(wěn)定性的角度考慮,最終選擇方案1。

方案1,最關(guān)鍵的是3、4、5步驟,因此需要預(yù)先做好回滾計劃。

04  回滾方案

回滾方案總原則是不丟數(shù)據(jù)。最有可能的發(fā)生點是雙寫期間新庫出問題,導致線上服務(wù)異常,這時只要立即關(guān)閉寫新庫即可,另外就是切到新庫后,新庫出問題了(如性能問題),可以立即切回到老庫,并通過反向任務(wù),保持數(shù)據(jù)一致性,最后若沒啟用分布式事務(wù),雙寫的時間越短越好,有可能會有數(shù)據(jù)不一致情況。

小結(jié)

通過周密的遷移方案設(shè)計,以及DTS強大的數(shù)據(jù)遷移工具的能力,閑魚商品庫順利完成XX億在線數(shù)據(jù)庫服務(wù)遷移,獨立的物理部署顯著提升商品庫在線服務(wù)的穩(wěn)定性。然而不同業(yè)務(wù)系統(tǒng)的數(shù)據(jù)庫情況可能會有差異,如單庫向多庫遷移,單表向多表遷移等,不過整體方案大致類似,希望本文遷庫實踐方案能給大家提供一個可行的參考。

參考資料

[1]TDDL開源Github地址 https://github.com/alibaba/tb_tddl

[2]阿里云DRDS產(chǎn)品官網(wǎng) https://www.aliyun.com/product/drds

[3]阿里云DTS產(chǎn)品官網(wǎng) https://www.aliyun.com/product/dts


網(wǎng)頁題目:21世紀了還愚公移山?數(shù)據(jù)庫這么遷移更穩(wěn)定!-創(chuàng)新互聯(lián)
鏈接URL:http://weahome.cn/article/dpddgi.html

其他資訊

在線咨詢

微信咨詢

電話咨詢

028-86922220(工作日)

18980820575(7×24)

提交需求

返回頂部