PXC簡介:
網(wǎng)站建設(shè)、成都網(wǎng)站制作服務(wù)團(tuán)隊(duì)是一支充滿著熱情的團(tuán)隊(duì),執(zhí)著、敏銳、追求更好,是創(chuàng)新互聯(lián)的標(biāo)準(zhǔn)與要求,同時竭誠為客戶提供服務(wù)是我們的理念。創(chuàng)新互聯(lián)公司把每個網(wǎng)站當(dāng)做一個產(chǎn)品來開發(fā),精雕細(xì)琢,追求一名工匠心中的細(xì)致,我們更用心!galera產(chǎn)品是以galera cluster方式為mysql提高高可用集群解決方案的。galera cluster就是集成了galera插件的mysql集群。galera replication是codership提供的mysql數(shù)據(jù)同步方案,具有高可用性,方便擴(kuò)展,并且可以實(shí)現(xiàn)多個mysql節(jié)點(diǎn)間的數(shù)據(jù)同步復(fù)制與讀寫,可保障數(shù)據(jù)庫的服務(wù)高可用及數(shù)據(jù)強(qiáng)一致性。
PXC屬于一套近乎完美的mysql高可用集群解決方案,相比那些比較傳統(tǒng)的基于主從復(fù)制模式的集群架構(gòu)MHA和MM+keepalived,galera cluster最突出特點(diǎn)就是解決了詬病已久的數(shù)據(jù)復(fù)制延遲問題,基本上可以達(dá)到實(shí)時同步。而且節(jié)點(diǎn)與節(jié)點(diǎn)之間,他們相互的關(guān)系是對等的。本身galera cluster也是一種多主架構(gòu)。galera cluster最關(guān)注的是數(shù)據(jù)的一致性,對待事物的行為時,要么在所有節(jié)點(diǎn)上執(zhí)行,要么都不執(zhí)行,它的實(shí)現(xiàn)機(jī)制決定了它對待一致性的行為非常嚴(yán)格,這也能非常完美的保證MySQL集群的數(shù)據(jù)一致性;
對galera cluster的封裝有兩個,雖然名稱不同,但實(shí)質(zhì)都是一樣的,使用的都是galera cluster。一個MySQL的創(chuàng)始人在自己全新的MariaDB上實(shí)現(xiàn)的MAriaDB cluster;一個是著名的MySQL服務(wù)和工具提供商percona實(shí)現(xiàn)的percona xtradb cluster,簡稱PXC
要搭建PXC架構(gòu)至少需要3個mysql實(shí)例來組成一個集群,三個實(shí)例之間不是主從模式,而是各自為主,所以三者是對等關(guān)系,不分從屬,這就叫multi-master架構(gòu)。客戶端寫入和讀取數(shù)據(jù)時,連接哪個實(shí)例都是一樣的。讀取到的數(shù)據(jù)時相同的,寫入任意一個實(shí)例之后,集群自己會將新寫入的數(shù)據(jù)同步到其他實(shí)例上,這種架構(gòu)不共享任何數(shù)據(jù),是一種高冗余架構(gòu)。
--:galera cluster的功能有7點(diǎn),如下:
①:多主架構(gòu):真正的多點(diǎn)讀寫集群,在任何時候讀寫的數(shù)據(jù)都是最新的;
②:同步復(fù)制:集群不同節(jié)點(diǎn)之間的數(shù)據(jù)同步,沒有延遲,在數(shù)據(jù)庫掛掉之后,數(shù)據(jù)不會丟失;
③:并發(fā)復(fù)制:從節(jié)點(diǎn)在apply數(shù)據(jù)時,支持并行執(zhí)行,有更好的性能表現(xiàn)
④:故障切換:因?yàn)橹С侄帱c(diǎn)寫入,所以在出現(xiàn)數(shù)據(jù)庫故障時可以很容易的進(jìn)行故障切換
⑤:熱插拔:在服務(wù)期間,如果數(shù)據(jù)庫掛了,只要監(jiān)控程序發(fā)現(xiàn)的夠快,不可服務(wù)時間就會非常少,在節(jié)點(diǎn)故障期間,節(jié)點(diǎn)本身對集群的影響非常小;
⑥:自動節(jié)點(diǎn)克隆:在新增節(jié)點(diǎn)或停機(jī)維護(hù)時,增量數(shù)據(jù)或基礎(chǔ)數(shù)據(jù)不需要人工手動備份提供,galera cluster會自動拉取在線節(jié)點(diǎn)數(shù)據(jù),集群最終會變?yōu)橐恢拢?/p>
⑦:對應(yīng)用透明:集群的維護(hù),對應(yīng)用程序是透明的,幾乎感覺不到;
--PXC原理:
PXC最常使用以下4個端口號:
3306-數(shù)據(jù)庫對外服務(wù)的端口號。
4444-請求SST的端口(SST是指數(shù)據(jù)庫一個備份全量文件的傳輸。)
4567-組成員之間進(jìn)行溝通的一個端口號
4568-用于傳輸IST(相對于SST來說的一個增量)
PXC的操作流程:
首先客戶端先發(fā)起一個事務(wù),該事務(wù)先在本地執(zhí)行,執(zhí)行完成之后就要發(fā)起對事務(wù)的提交操作了。在提交之前需要將產(chǎn)生的復(fù)制寫集廣播出去,然后獲取到一個全局的事務(wù)ID號,一并傳送到另一個節(jié)點(diǎn)上面。通過合并數(shù)據(jù)之后,發(fā)現(xiàn)沒有沖突數(shù)據(jù),執(zhí)行apply_cd和commit_cb動作,否則就需要取消此次事務(wù)的操作。而當(dāng)前server節(jié)點(diǎn)通過驗(yàn)證之后,執(zhí)行提交操作,并返回OK,如果驗(yàn)證沒通過,則執(zhí)行回滾。當(dāng)然在生產(chǎn)中至少要有3個節(jié)點(diǎn)的集群環(huán)境,如果其中一個節(jié)點(diǎn)沒有驗(yàn)證通過,出現(xiàn)了數(shù)據(jù)沖突,那么此時采取的方式就是講出現(xiàn)不一致的節(jié)點(diǎn)踢出集群環(huán)境,而且它自己會執(zhí)行shutdown命令,自動關(guān)機(jī)。
PXC的優(yōu)點(diǎn):
①:實(shí)現(xiàn)mysql數(shù)據(jù)庫集群架構(gòu)的高可用性和數(shù)據(jù)的 強(qiáng)一致性。
②:完成了真正的多節(jié)點(diǎn)讀寫的集群方案。
③:改善了傳統(tǒng)意義上的主從復(fù)制延遲問題,基本上達(dá)到了實(shí)時同步。
④:新加入的節(jié)點(diǎn)可以自動部署,無須提供手動備份,維護(hù)起來很方便。
⑤:由于是多節(jié)點(diǎn)寫入,所以數(shù)據(jù)庫故障切換很容易。
PXC的缺點(diǎn):
①:新加入的節(jié)點(diǎn)開銷大,需要復(fù)制完整的數(shù)據(jù)。采用SST傳輸開銷太大。
②:任何更新事務(wù)都需要全局驗(yàn)證通過,才會在每個節(jié)點(diǎn)庫上執(zhí)行。集群性能受限于性能最差的節(jié)點(diǎn),也就是經(jīng)常說的短板效應(yīng)。
③:因?yàn)樾枰WC數(shù)據(jù)的一致性,所以在多節(jié)點(diǎn)并發(fā)寫時,鎖沖突問題比較嚴(yán)重。
④:存在寫擴(kuò)大問題,所有的節(jié)點(diǎn)上都會發(fā)生些操作。
⑤:只支持innodb存儲引擎的表。
⑥:沒有表級別的鎖定,執(zhí)行DDL語句操作會把整個集群鎖住,而且也 kill 不了(建議使用Osc操作,即在線DDL)
⑦:所有的表必須含有主鍵,不然操作數(shù)據(jù)時會報錯。
PXC搭建的注意點(diǎn):
首先要規(guī)范集群中節(jié)點(diǎn)的數(shù)量,整個集群中節(jié)點(diǎn)數(shù)控制在最少3個、最多8個范圍內(nèi)。最少3個節(jié)點(diǎn)是為了防止出現(xiàn)腦裂現(xiàn)象,因?yàn)橹挥性趦蓚€節(jié)點(diǎn)下才會出現(xiàn)此現(xiàn)象。腦裂現(xiàn)象的標(biāo)志就是輸入任何命令、返回結(jié)果都是unkown command,節(jié)點(diǎn)在集群中,會因?yàn)樾鹿?jié)點(diǎn)的加入或者故障,同步失效等而發(fā)生狀態(tài)的切換。
--節(jié)點(diǎn)狀態(tài)變化階段:
open:節(jié)點(diǎn)啟動成功,嘗試連接到集群。
primary:節(jié)點(diǎn)已處于集群中,在新節(jié)點(diǎn)加入時,選取donor進(jìn)行數(shù)據(jù)同步時會產(chǎn)生的狀態(tài)。
joiner:節(jié)點(diǎn)處于等待接收同步文件時的狀態(tài)。
joined:節(jié)點(diǎn)完成數(shù)據(jù)同步的工作,嘗試保持和集群進(jìn)度一致。
synced:節(jié)點(diǎn)正常提供服務(wù)的狀態(tài),表示已經(jīng)同步完成并和集群進(jìn)度保持一致。
doner:節(jié)點(diǎn)處于為新加入的節(jié)點(diǎn)提供全量數(shù)據(jù)時的狀態(tài)。
注意:doner節(jié)點(diǎn)就是數(shù)據(jù)的貢獻(xiàn)者,如果一個新節(jié)點(diǎn)加入集群,此時又需要大量數(shù)據(jù)的SST傳輸,就有可能因此而拖垮整個集群的性能。所以在生產(chǎn)環(huán)境中,如果數(shù)據(jù)量小,還可以使用SST全量傳輸,但如果數(shù)據(jù)量很大就不建議使用這種方式了??梢钥紤]先建立主從關(guān)系,在加入集群。
PXC有兩種節(jié)點(diǎn)的數(shù)據(jù)傳輸方式:一種叫SST全量傳輸,另一種叫IST增量傳輸。
SST傳輸有:xtrabackup、mysqldump和rsync三種方法。而增量傳輸就一種方法就是xtrabackup。但生產(chǎn)環(huán)境中一般數(shù)據(jù)量不大的時候,可以使用SST全量傳輸,但也只實(shí)現(xiàn)xtrabackup方法。
在PXC中還有一個特別重要的模塊就是GCache。它的核心功能就是每個節(jié)點(diǎn)緩存當(dāng)前最新的寫集。如果有新節(jié)點(diǎn)加入進(jìn)來,就可以把新數(shù)據(jù)的增量傳遞給新節(jié)點(diǎn),而不需要再使用SST方式了。這樣可以讓節(jié)點(diǎn)更快地加入集群中。涉及參數(shù)如下:
gcache.size:代表用來緩存寫集增量信息的大小。它的默認(rèn)大小是128MB,通過wsrep_provider_options參數(shù)設(shè)置。建議調(diào)整為2GB-4GB范圍,足夠的空間便于緩存更多的增量信息。
gcache.mem_size:代表gcache中內(nèi)存緩存的大小,適度調(diào)大可以提高整個集群的性能。
gcache.page_size:可以理解為如果內(nèi)存不夠用(gcache不足),就直接將寫集寫入磁盤文件中。
--:PXC的工作模式:
galera的工作模式是——某個節(jié)點(diǎn)寫入一個事務(wù),它會廣播到其他節(jié)點(diǎn),而這個所謂的其他節(jié)點(diǎn),也包括自己。也就說自己發(fā)出來的事務(wù),自己也會收到,只是在收到并產(chǎn)生GTID之后,就被簡單忽略了,而不會再去apply一次。
--:galera的并發(fā)控制機(jī)制:
并發(fā)控制主要是在接口galera_pre_commit中完成的,這個接口是galera最重要的接口之一,這里面實(shí)現(xiàn)了最重要的復(fù)制、驗(yàn)證邏輯。目前,這個接口中包括的并發(fā)控制有以下幾點(diǎn):
①:數(shù)據(jù)復(fù)制:
目前的galera版本中,寫集數(shù)據(jù)的發(fā)送是通過asio的異步方式將數(shù)據(jù)廣播出去。這個發(fā)送是串行的,是一個臨界區(qū),因?yàn)樵诿看?發(fā)送前,邏輯上還需要分片,并且每次發(fā)送完成之后,需要等待一個GTID的值,所以為了保證數(shù)據(jù)的一致性,這個發(fā)送操作需要串行;
②:寫集驗(yàn)證:
要求所有進(jìn)入處理區(qū)的GTID必須是順序的,因?yàn)镚TID是順序產(chǎn)生的,所以在順序的基礎(chǔ)上,同一時間必須只有一個事務(wù)可以進(jìn)行處理,說白了就是串行;
受這種層次并發(fā)控制管理的操作主要有驗(yàn)證操作,因此說驗(yàn)證是串行的;
③:寫集apply
④:事務(wù)commit
這個層次的并發(fā)控制機(jī)制,默認(rèn)是3,建議也是3,就是串行提交,這樣就保證了不管在主庫還是從庫,所有的節(jié)點(diǎn)產(chǎn)生的binlog都是完全相同的;
3、galera 接口:
---galera_init:
這個接口的作用是初始化一個galera節(jié)點(diǎn),這是一個PXC節(jié)點(diǎn)調(diào)用的第一個wsrep接口,在啟動服務(wù)器的時候初始化,將所有需要的參數(shù)和環(huán)境變量初始化。(如:集群名字,實(shí)例地址、需要這個接口做binlog的復(fù)制等)
---galera_connect:
這個接口是第二個調(diào)用的接口。這個接口的作用是將當(dāng)前節(jié)點(diǎn)加入集群中。加入集群前會調(diào)用函數(shù)wsrep_view_handler_cb來判斷新加入節(jié)點(diǎn)與集群的數(shù)據(jù)是否同步;
---galera_recv:
這個接口的作用是,在這個函數(shù)里阻塞式的接收其他節(jié)點(diǎn)及本節(jié)點(diǎn)發(fā)送的數(shù)據(jù),并且調(diào)用復(fù)制apply函數(shù)執(zhí)行復(fù)制操作。(這個接口實(shí)際上是可以并行存在的。它對應(yīng)的是參數(shù)wsrep_slave_threads有多少個線程,就有多少個galera_recv的調(diào)用)
---galera_pre_commit:
這個接口是galera最重要的接口之一。它的作用包括兩部分,首先是將當(dāng)前指定的事務(wù)寫集廣播給整個集群節(jié)點(diǎn),然后就是驗(yàn)證,如果驗(yàn)證成功,則將處理權(quán)交給上層,繼續(xù)做數(shù)據(jù)庫事務(wù)的提交操作;這個接口是在數(shù)據(jù)庫事務(wù)提交時調(diào)用的,調(diào)用這個接口時,必須是本地事務(wù)已經(jīng)執(zhí)行完成;
---galera_replay_trx:
這個接口的作用及使用,就是在驗(yàn)證過程中,由于數(shù)據(jù)庫鎖的沖突,當(dāng)前操作被其他線程自治縣了galera_abort_pre_com_mit,導(dǎo)致當(dāng)前線程被強(qiáng)制中止,但是由于寫集已經(jīng)復(fù)制到其他節(jié)點(diǎn),所以本節(jié)點(diǎn)這個事務(wù)必須要完成。通過這個接口,將這個事務(wù)的寫集做一次apply,所以就叫replay;
---galera_append_key:
這個接口就是所謂的galera驗(yàn)證,被驗(yàn)證的對象實(shí)際上就是寫集,而構(gòu)成寫集的內(nèi)容,其實(shí)就是通過這個接口來完成的;
---galera_append_data:
這個接口是當(dāng)前事務(wù)所生成的binlog內(nèi)容,也就是說key在驗(yàn)證通過之后,使用data在從節(jié)點(diǎn)執(zhí)行,即可做到數(shù)據(jù)同步;
---galera_post_commit:
這個接口是用來真正提交事務(wù)的。這個接口包括4個功能:更新狀態(tài)參數(shù)wsrep_last_committed的值,表示當(dāng)前事務(wù)已經(jīng)真正提交了;更新參數(shù)wsrep_local_commits的值,表示本地又成功提交了一個事務(wù);檢查當(dāng)前驗(yàn)證寫集緩沖區(qū)是不是可以做purge操作;
---galera_to_execute_start:
這個接口專門用來處理DDL語句的執(zhí)行;
---galera_to_execute_end:
這個接口實(shí)際上和galera_post_commit功能一樣,成對出現(xiàn),是為處理不同語句而設(shè)置的,主要就是為了從commit臨界區(qū)中出來,從而讓其他事務(wù)繼續(xù)提交;
另外有需要云服務(wù)器可以了解下創(chuàng)新互聯(lián)cdcxhl.cn,海內(nèi)外云服務(wù)器15元起步,三天無理由+7*72小時售后在線,公司持有idc許可證,提供“云服務(wù)器、裸金屬服務(wù)器、高防服務(wù)器、香港服務(wù)器、美國服務(wù)器、虛擬主機(jī)、免備案服務(wù)器”等云主機(jī)租用服務(wù)以及企業(yè)上云的綜合解決方案,具有“安全穩(wěn)定、簡單易用、服務(wù)可用性高、性價比高”等特點(diǎn)與優(yōu)勢,專為企業(yè)上云打造定制,能夠滿足用戶豐富、多元化的應(yīng)用場景需求。