Porter是一款數(shù)據(jù)同步中間件,主要用于解決同構(gòu)/異構(gòu)數(shù)據(jù)庫(kù)之間的表級(jí)別數(shù)據(jù)同步問(wèn)題。
創(chuàng)新互聯(lián)10多年成都定制網(wǎng)站服務(wù);為您提供網(wǎng)站建設(shè),網(wǎng)站制作,網(wǎng)頁(yè)設(shè)計(jì)及高端網(wǎng)站定制服務(wù),成都定制網(wǎng)站及推廣,對(duì)成都門(mén)簾等多個(gè)方面擁有多年的網(wǎng)站設(shè)計(jì)經(jīng)驗(yàn)的網(wǎng)站建設(shè)公司。
在微服務(wù)架構(gòu)模式下深刻的影響了應(yīng)用和數(shù)據(jù)庫(kù)之間的關(guān)系,不像傳統(tǒng)多個(gè)服務(wù)共享一個(gè)數(shù)據(jù)庫(kù),微服務(wù)架構(gòu)下每個(gè)服務(wù)都要有自己的數(shù)據(jù)庫(kù)。如果你想獲得微服務(wù)帶來(lái)的好處,每個(gè)服務(wù)獨(dú)有一個(gè)數(shù)據(jù)庫(kù)是必須的,因?yàn)槲⒎?wù)強(qiáng)調(diào)的就是松耦合。我們希望數(shù)據(jù)庫(kù)就和服務(wù)一樣,要有充分的獨(dú)立性、可以和服務(wù)一起部署、一起擴(kuò)展、一起重構(gòu)。同時(shí),還需要兼顧數(shù)據(jù)中心的數(shù)據(jù)聚合、DBA的多種數(shù)據(jù)庫(kù)備份、報(bào)表中心的業(yè)務(wù)報(bào)表等等矛盾問(wèn)題。因此便產(chǎn)生了「Porter」項(xiàng)目。
微服務(wù)改造過(guò)程中,無(wú)法避免的一個(gè)坎,那就是垂直拆庫(kù),根據(jù)不同的子服務(wù),把過(guò)去的「一庫(kù)多服」拆分成「一庫(kù)一服」。
不管是否是微服務(wù)架構(gòu),應(yīng)用的各個(gè)模塊之間都需要頻繁的通信、協(xié)作、共享數(shù)據(jù),實(shí)現(xiàn)系統(tǒng)的整體價(jià)值。區(qū)別點(diǎn)在于單體應(yīng)用是通過(guò)本地方法調(diào)用來(lái)完成;在微服務(wù)中是通過(guò)遠(yuǎn)程API調(diào)用完成。
而共享數(shù)據(jù)最賤的方式就是采用共享數(shù)據(jù)庫(kù)模式,也就是單體應(yīng)用中最常用的方式,一般只有一個(gè)數(shù)據(jù)庫(kù),如圖一庫(kù)多服和一庫(kù)一服的方式:
一庫(kù)多服的架構(gòu)模式通常會(huì)被認(rèn)為是微服務(wù)架構(gòu)下的反范式,它的問(wèn)題在于:
穩(wěn)定性:?jiǎn)吸c(diǎn)故障,一個(gè)數(shù)據(jù)庫(kù)掛掉,整批服務(wù)全部停止。服務(wù)獨(dú)立性被扼殺?
耦合性:數(shù)據(jù)在一起,會(huì)給貪圖方便的開(kāi)發(fā)或者DBA工程師編寫(xiě)很多數(shù)據(jù)間高度依賴的程序或者工具;
擴(kuò)展性:無(wú)法針對(duì)某一個(gè)服務(wù)進(jìn)行精準(zhǔn)優(yōu)化或擴(kuò)展,服務(wù)會(huì)大體分為兩個(gè)讀多寫(xiě)少、寫(xiě)多讀少,數(shù)據(jù)庫(kù)優(yōu)化是根據(jù)服務(wù)而來(lái)的,不是一篇而論。
所以隨行付內(nèi)部一般推薦的做法:是為每一個(gè)微服務(wù)準(zhǔn)備一個(gè)單獨(dú)的數(shù)據(jù)庫(kù),即一庫(kù)一服模式。這種模式更加適合微服務(wù)架構(gòu),它滿足每一個(gè)服務(wù)是獨(dú)立開(kāi)發(fā)、獨(dú)立部署、獨(dú)立擴(kuò)展的特性。當(dāng)需要對(duì)一個(gè)服務(wù)進(jìn)行升級(jí)或者數(shù)據(jù)架構(gòu)改動(dòng)的時(shí)候,無(wú)須影響到其他的服務(wù)。需要對(duì)某個(gè)服務(wù)進(jìn)行擴(kuò)展的時(shí)候,也可以手術(shù)式的對(duì)某一個(gè)服務(wù)進(jìn)行局部擴(kuò)容。
那么問(wèn)題來(lái)了,在改造中我們發(fā)現(xiàn),以下問(wèn)題,誕生了該項(xiàng)目:
報(bào)表中心和前端詳細(xì)頁(yè)都存在SQL Join方式,經(jīng)歷我們一庫(kù)一服的拆分后,無(wú)法在繼續(xù)使用SQL Join方式了...
數(shù)據(jù)中心,做得是數(shù)據(jù)聚合,數(shù)據(jù)拆分后,給數(shù)據(jù)中心帶來(lái)了很大的麻煩...
微服務(wù)之后,各個(gè)應(yīng)用模塊對(duì)數(shù)據(jù)庫(kù)的要求出現(xiàn)了分歧,數(shù)據(jù)庫(kù)類(lèi)型多元化自主選擇還是統(tǒng)一...
等等...
Porter是一個(gè)集中式的數(shù)據(jù)處理通道,所有的數(shù)據(jù)都在這個(gè)數(shù)據(jù)處理平臺(tái)匯聚、分發(fā)。Porter是一個(gè)無(wú)中心、插件友好型分布式數(shù)據(jù)同步中間件。默認(rèn)注冊(cè)中心插件實(shí)現(xiàn)為zookeeper, 當(dāng)然,你也可以基于注冊(cè)中心接口實(shí)現(xiàn)自定義注冊(cè)中心模塊。在Porter的主流程外分布著集群插件、源端消費(fèi)插件、源端消息轉(zhuǎn)換器插件、目標(biāo)端寫(xiě)入插件、告警插件、自定義數(shù)據(jù)定義插件等插件模塊,除了集群插件、告警插件是Porter任務(wù)節(jié)點(diǎn)全局作用域外,其余插件模塊都隨著同步任務(wù)的不同而相應(yīng)組合。得益于良好的設(shè)計(jì)模式,Porter才能為大家呈現(xiàn)如此靈活的擴(kuò)展性與易用性。
Porter始于2017年,提供數(shù)據(jù)同步功能,但并不僅僅局限于數(shù)據(jù)同步,在隨行付內(nèi)部廣泛使用。主要提供一下功能:
原生支持Oracle|MySQL到Jdbc關(guān)系型數(shù)據(jù)庫(kù)最終一致同步
插件友好化,支持自定義源端消費(fèi)插件、目標(biāo)端載入插件、告警插件等插件二次開(kāi)發(fā)。
支持自定義源端、目標(biāo)端表、字段映射
支持節(jié)點(diǎn)基于配置文件的同步任務(wù)配置。
支持管理后臺(tái)同步任務(wù)推送,節(jié)點(diǎn)、任務(wù)管理。提供任務(wù)運(yùn)行指標(biāo)監(jiān)控,節(jié)點(diǎn)運(yùn)行日志、任務(wù)異常告警。
支持節(jié)點(diǎn)資源限流、分配。
基于Zookeeper集群插件的分布式架構(gòu)。支持自定義集群插件。
Porter節(jié)點(diǎn)通過(guò)注冊(cè)中心實(shí)現(xiàn)分布式集群,并根據(jù)資源需求動(dòng)態(tài)擴(kuò)縮容。Portert與注冊(cè)中心協(xié)商了一套任務(wù)、節(jié)點(diǎn)、統(tǒng)計(jì)接口,Porter節(jié)點(diǎn)通過(guò)監(jiān)聽(tīng)注冊(cè)中心接口數(shù)據(jù)的變化實(shí)現(xiàn)任務(wù)的分配管理。配置管理后臺(tái)遵守并實(shí)現(xiàn)注冊(cè)中心的接口規(guī)范,實(shí)現(xiàn)對(duì)Porter節(jié)點(diǎn)遠(yuǎn)程管理。注冊(cè)中心同樣有一套分布式鎖機(jī)制,用于任務(wù)資源的分配。
在這個(gè)機(jī)制外,Porter節(jié)點(diǎn)可以通過(guò)本地配置文件的方式實(shí)現(xiàn)任務(wù)的定義。
1、基于Canal開(kāi)源產(chǎn)品,獲取MySql數(shù)據(jù)庫(kù)增量日志數(shù)據(jù)。
2、管理系統(tǒng)架構(gòu)。管理節(jié)點(diǎn)(web manager)管理工作節(jié)點(diǎn)任務(wù)編排、數(shù)據(jù)工作節(jié)點(diǎn)(TaskWork)匯報(bào)工作進(jìn)度
3、基于Zookeeper集群插件的分布式架構(gòu)。支持自定義集群插件
4、基于Kafka消息組件,每張表對(duì)應(yīng)一個(gè)Topic,數(shù)據(jù)節(jié)點(diǎn)分Topic消費(fèi)工作
為了保證數(shù)據(jù)的一致性,源端數(shù)據(jù)提取與目標(biāo)端插入采用單線程順序執(zhí)行,中間階段通過(guò)多線程執(zhí)行提高數(shù)據(jù)處理速度。對(duì)照上圖就是SelectJob與LoadJob單線程執(zhí)行,ExtractJob、TransformJob線程并行執(zhí)行,然后在LoadJob階段對(duì)數(shù)據(jù)包進(jìn)行排序,順序?qū)懭肽繕?biāo)端。
正如文章開(kāi)頭所說(shuō),告警插件與注冊(cè)中心插件在多個(gè)任務(wù)間共享,每個(gè)任務(wù)根據(jù)源端與目標(biāo)端的類(lèi)型、源端數(shù)據(jù)格式選擇與之相匹配的處理插件。也就是說(shuō)告警插件、注冊(cè)中心插件與Porter節(jié)點(diǎn)配置相關(guān),數(shù)據(jù)消費(fèi)插件、目標(biāo)端插件、自定義數(shù)據(jù)處理插件等插件與任務(wù)配置相關(guān)。
Porter通過(guò)SPI規(guī)范結(jié)合單例、工廠、監(jiān)聽(tīng)者模式等設(shè)計(jì)模式,實(shí)現(xiàn)了極大的靈活性與松耦合,滿足不同場(chǎng)景的二次開(kāi)發(fā)。具體涵蓋如下四個(gè)方面的插件化設(shè)計(jì):
注冊(cè)中心插件
源端消費(fèi)插件
目標(biāo)端載入插件
自定義數(shù)據(jù)處理插件
Porter的集群模式依賴集群插件,默認(rèn)的集群插件基于zookeeper實(shí)現(xiàn)。Porter任務(wù)節(jié)點(diǎn)和管理節(jié)點(diǎn)并不是強(qiáng)制綁定關(guān)系,任務(wù)部署可以通過(guò)任務(wù)配置文件,也可以通過(guò)管理節(jié)點(diǎn)推送。管理節(jié)點(diǎn)還可以管理節(jié)點(diǎn)、收集、展示監(jiān)控指標(biāo)信息等,是一個(gè)不錯(cuò)的、簡(jiǎn)化運(yùn)維的管理平臺(tái)。同樣的,可以基于zookeeper數(shù)據(jù)結(jié)構(gòu)協(xié)議實(shí)現(xiàn)你自己的管理平臺(tái)。集群模式下的系統(tǒng)結(jié)構(gòu):
zookeeper數(shù)據(jù)結(jié)構(gòu)協(xié)議:
Porter的集群機(jī)制主要有以下功能:
實(shí)現(xiàn)節(jié)點(diǎn)任務(wù)的負(fù)載,當(dāng)前任務(wù)節(jié)點(diǎn)失效后自動(dòng)漂移到其他任務(wù)節(jié)點(diǎn)
實(shí)現(xiàn)任務(wù)節(jié)點(diǎn)與管理節(jié)點(diǎn)的通信
實(shí)現(xiàn)任務(wù)處理進(jìn)度的存儲(chǔ)與拉取
實(shí)現(xiàn)統(tǒng)計(jì)指標(biāo)數(shù)據(jù)的上傳(最新的開(kāi)發(fā)版本支持自定義統(tǒng)計(jì)指標(biāo)上傳客戶端,原生支持kafka)
用于節(jié)點(diǎn)、任務(wù)搶占的分布式鎖實(shí)現(xiàn)
基于文件系統(tǒng)的單機(jī)模式插件
最新開(kāi)發(fā)版支持Porter任務(wù)節(jié)點(diǎn)以單機(jī)模式運(yùn)行,不依賴管理后臺(tái)和zookeeper,通過(guò)配置文件配置任務(wù)。單機(jī)模式是一種特殊的集群模式,僅支持部分集群功能,但簡(jiǎn)化了任務(wù)部署的復(fù)雜性,靈活多變。
實(shí)現(xiàn)任務(wù)處理進(jìn)度的存儲(chǔ)與拉取
實(shí)現(xiàn)統(tǒng)計(jì)指標(biāo)數(shù)據(jù)的上傳
Porter任務(wù)節(jié)點(diǎn)運(yùn)行模式的配置方式
#zookeeper集群配置
porter.cluster.strategy=ZOOKEEPER
porter.cluster.client.url=127.0.0.1:2181
porter.cluster.client.sessionTimeout=100000
#單機(jī)模式配置
porter.cluster.strategy=STANDALONE
porter.cluster.client.home=/path/.porter