真实的国产乱ⅩXXX66竹夫人,五月香六月婷婷激情综合,亚洲日本VA一区二区三区,亚洲精品一区二区三区麻豆

成都創(chuàng)新互聯(lián)網(wǎng)站制作重慶分公司

GitHub開源的MySQL在線更改Schema工具gh-ost是怎樣的

今天就跟大家聊聊有關(guān)GitHub開源的MySQL在線更改Schema工具gh-ost是怎樣的,可能很多人都不太了解,為了讓大家更加了解,小編給大家總結(jié)了以下內(nèi)容,希望大家根據(jù)這篇文章可以有所收獲。

在房山等地區(qū),都構(gòu)建了全面的區(qū)域性戰(zhàn)略布局,加強發(fā)展的系統(tǒng)性、市場前瞻性、產(chǎn)品創(chuàng)新能力,以專注、極致的服務(wù)理念,為客戶提供成都網(wǎng)站制作、網(wǎng)站設(shè)計 網(wǎng)站設(shè)計制作按需設(shè)計網(wǎng)站,公司網(wǎng)站建設(shè),企業(yè)網(wǎng)站建設(shè),品牌網(wǎng)站制作,全網(wǎng)營銷推廣,外貿(mào)網(wǎng)站建設(shè),房山網(wǎng)站建設(shè)費用合理。

MySQL在線更改schema的工具很多,如Percona的pt-online-schema-change、 Facebook的 OSC 和 LHM  等,但這些都是基于觸發(fā)器(Trigger)的,今天咱們介紹的 gh-ost 號稱是不需要觸發(fā)器(Triggerless)支持的在線更改表結(jié)構(gòu)的工具。

GitHub開源的MySQL在線更改Schema工具gh-ost是怎樣的

原文地址:gh-ost: GitHub's online schema migration tool for MySQL

本文先介紹一下當前業(yè)界已經(jīng)存在的這些工具的使用場景和原理,然后再詳細介紹 gh-ost 的工作原理和特性。

今天我們開源了GitHub內(nèi)部使用的一款 不需要觸發(fā)器支持的 MySQL 在線更改表結(jié)構(gòu)的工具 gh-ost

開發(fā) gh-ost 是為了應(yīng)付GitHub在生產(chǎn)環(huán)境中面臨的持續(xù)的、不斷變化的在線修改表結(jié)構(gòu)的需求。gh-ost  通過提供低影響、可控、可審計和操作友好的解決方案改變了現(xiàn)有的在線遷移表工具的工作模式。

MySQL表遷移及結(jié)構(gòu)更改操作是業(yè)界眾所周知的問題,2009年以來已經(jīng)可以通過在線(不停服務(wù))變更的工具來解決。迅速增長,快速迭代的產(chǎn)品往往需要頻繁的需改數(shù)據(jù)庫的結(jié)構(gòu)。增加/更改/刪除/  字段和索引等等,這些操作在MySQL中默認都會鎖表,影響線上的服務(wù)。  向這種數(shù)據(jù)庫結(jié)構(gòu)層面的變更我們每天都會面臨多次,當然這種操作不應(yīng)該影響用戶的正常服務(wù)。

在開始介紹 gh-ost 工具之前,咱們先來看一下當前現(xiàn)有的這些工具的解決方案。

在線修改表結(jié)構(gòu),已存在的場景

如今,在線修改表結(jié)構(gòu)可以通過下面的三種方式來完成:

  • 在從庫上修改表結(jié)構(gòu),操作會在其他的從庫上生效,將結(jié)構(gòu)變更了的從庫設(shè)置為主庫

  • 使用 MySQL InnoDB 存儲引擎提供的在線DDL特性

  • 使用在線修改表結(jié)構(gòu)的工具?,F(xiàn)在***的是 pt-online-schema-change 和 Facebook 的 OSC;當然還有 LHM 和比較原始的  oak-online-alter-table 工具。

其他的還包括 Galera 集群的Schema滾動更新,以及一些其他的非InnoDB的存儲引擎等待,在 GitHub 我們使用通用的 主-從 架構(gòu) 和  InnoDB 存儲引擎。

為什么我們決定開始一個新的解決方案,而不是使用上面的提到的這些呢?現(xiàn)有的每種解決方案都有其局限性,下文會對這些方式的普遍問題簡單的說明一下,但會對基于觸發(fā)器的在線變更工具的問題進行詳細說明。

  • 基于主從復(fù)制的遷移方式需要很多的前置工作,如:大量的主機,較長的傳輸時間,復(fù)雜的管理等等。變更操作需要在一個指定的從庫上或者基于sub-tree的主從結(jié)構(gòu)中執(zhí)行。需要的情況也比較多,如:主機宕機、主機從早先的備份中恢復(fù)數(shù)據(jù)、新主機加入到集群等等,所有這些情況都有可能對我們的操作造成影響。最要命的是可能這些操作一天要進行很多次,如果使用這種方法我們操作人員每天的效率是非常高的(譯者注:現(xiàn)如今很少有人用這種方式了吧)

  • MySQL針對Innodb存儲引擎的在線DDL操作在開始之前都需要一個短時間排它鎖(exclusive)來準備環(huán)境,所以  alter命令發(fā)出后,會首先等待該表上的其它操作完成,在alter命令之后的請求會出現(xiàn)等待waiting meta data  lock。同樣在ddl結(jié)束之前,也要等待alter期間所有的事務(wù)完成,也會堵塞一小段時間,這對于繁忙的數(shù)據(jù)庫服務(wù)來說危險系數(shù)是非常高的。另外  DDL操作不能中斷,如果中途kill掉,會造成長時間的事務(wù)回滾,還有可能造成元數(shù)據(jù)的損壞。它操作起來并不那么的Nice,不能限流和暫停,在大負載的環(huán)境中甚至?xí)绊懻5臉I(yè)務(wù)。

  • 我們用了很多年的 pt-online-schema-change 工具。然而隨著我們不斷增長的業(yè)務(wù)和流量,我們遇到了很多的問題,我們必須考慮在操作中的哪些  危險操作  (譯者注:pt工具集的文檔中經(jīng)常會有一些危險提示)。某些操作必須避開高峰時段來進行,否則MySQL可能就掛了。所有現(xiàn)存的在線表結(jié)構(gòu)修改的工具都是利用了MySQL的觸發(fā)器來執(zhí)行的,這種方式有一些潛藏的問題。

基于觸發(fā)器的在線修改有哪些問題呢?

所有在線表結(jié)構(gòu)修改工具的操作方式都類似:創(chuàng)建與原表結(jié)構(gòu)一致的臨時表,該臨時表已經(jīng)是按要求修改后的表結(jié)構(gòu)了,緩慢增量的從原表中復(fù)制數(shù)據(jù),同時記錄原表的更改(所有的  INSERT, DELETE, UPDATE 操作) 并應(yīng)用到臨時表。當工具確認表數(shù)據(jù)已經(jīng)同步完成,它會進行替換工作,將臨時表更名為原表。

pt-online-schema-change, LHM 和 oak-online-alter-table  這些工具都使用同步的方式,當原表有變更操作時利用一些事務(wù)的間隙時間將這些變化同步到臨時表。Facebook  的工具使用異步的方式將變更寫入到changelog表中,然后重復(fù)的將changelog表的變更應(yīng)用到臨時表。所有的這些工具都使用觸發(fā)器來識別原表的變更操作。

當表中的每一行數(shù)據(jù)有 INSERT, DELETE, UPDATE  操作時都會調(diào)用存儲的觸發(fā)器。一個觸發(fā)器可能在一個事務(wù)空間中包含一系列查詢操作。這樣就會造成一個原子操作不單會在原表執(zhí)行,還會調(diào)用相應(yīng)的觸發(fā)器執(zhí)行多個操作。

在基于觸發(fā)器遷移實踐中,遇到了如下的問題:

  • 觸發(fā)器是以解釋型代碼的方式保存的。MySQL 不會預(yù)編譯這些代碼。  會在每次的事務(wù)空間中被調(diào)用,它們被添加到被操作的表的每個查詢行為之前的分析和解釋器中。

  • 鎖表:觸發(fā)器在原始表查詢中共享相同的事務(wù)空間,而這些查詢在這張表中會有競爭鎖,觸發(fā)器在另外一張表會獨占競爭鎖。在這種極端情況下,同步方式的鎖爭奪直接關(guān)系到主庫的并發(fā)寫性能。以我們的經(jīng)驗來說,在生產(chǎn)環(huán)境中當競爭鎖接近或者結(jié)束時,數(shù)據(jù)庫可能會由于競爭鎖而被阻塞住。觸發(fā)鎖的另一個方面是創(chuàng)建或銷毀時所需要的元數(shù)據(jù)鎖。我們曾經(jīng)遇到過在繁忙的表中當表結(jié)構(gòu)修改完成后,刪除觸發(fā)器可能需要數(shù)秒到分鐘的時間。

  • 不可信:當主庫的負載上升時,我們希望降速或者暫停操作,但基于觸發(fā)器的操作并不能這么做。雖然它可以暫停行復(fù)制操作,但卻不能暫停出觸發(fā)器,如果刪除觸發(fā)器可能會造成數(shù)據(jù)丟失,因此觸發(fā)器需要在整個操作過程中都要存在。在我們比較繁忙的服務(wù)器中就遇到過由于觸發(fā)器占用CPU資源而將主庫拖死的例子。

  • 并發(fā)遷移:我們或者其他的人可能比較關(guān)注多個同時修改表結(jié)構(gòu)(不同的表)的場景。鑒于上述觸發(fā)器的開銷,我們沒有興趣同時對多個表進行在線修改操作,我們也不確定是否有人在生產(chǎn)環(huán)境中這樣做過。

  • 測試:我們修改表結(jié)構(gòu)可能只是為了測試,或者評估其負載開銷。基于觸發(fā)器的表結(jié)構(gòu)修改操作只能通過基于語句復(fù)制的方式來進行模擬實驗,離真實的主庫操作還有一定的距離,不能真實的反映實際情況。

gh-ost

gh-ost GitHub 的在線 Schema 修改工具,下面工作原理圖:

GitHub開源的MySQL在線更改Schema工具gh-ost是怎樣的

gh-ost 具有如下特性:

  • 無觸發(fā)器

  • 輕量級

  • 可暫停

  • 可動態(tài)控制

  • 可審計

  • 可測試

  • 值得信賴

無觸發(fā)器

gh-ost  沒有使用觸發(fā)器。它通過分析binlog日志的形式來監(jiān)聽表中的數(shù)據(jù)變更。因此它的工作模式是異步的,只有當原始表的更改被提交后才會將變更同步到臨時表(ghost  table)

gh-ost 要求binlog是RBR格式 (  基于行的復(fù)制);然而也不是說你就不能在基于SBR(基于語句的復(fù)制)日志格式的主庫上執(zhí)行在線變更操作。實際上是可以的。gh-ost 可以將從庫的  SBR日志轉(zhuǎn)換為RBR日志,只需要重新配置就可以了。

輕量級

由于沒有使用觸發(fā)器,因此在操作的過程中對主庫的影響是最小的。當然在操作的過程中也不用擔心并發(fā)和鎖的問題。  變更操作都是以流的形式順序的寫到binlog文件中,gh-ost只是讀取他們并應(yīng)用到gh-ost表中。實際上,gh-ost  通過讀取binlog的寫事件來進行順序的行復(fù)制操作。因此,主庫只會有一個單獨連接順序的將數(shù)據(jù)寫入到臨時表(ghost  table)。這和ETL操作有很大的不同。

可暫停

所有的寫操作都是由gh-ost控制的,并且以異步的方式讀取binlog,當限速的時候,gh-ost可以暫停向主庫寫入數(shù)據(jù),限速意味著不會在主庫進行復(fù)制,也不會有行更新。當限速時gh-ost會創(chuàng)建一個內(nèi)部的跟蹤(tracking)表,以最小的系統(tǒng)開銷向這個表中寫入心跳事件

gh-ost 支持多種方式的限速:

  • 負載: 為熟悉 pt-online-schema-change 工具的用戶提供了類似的功能,可以設(shè)置MySQL中的狀態(tài)閾值,如  Threads_running=30

  • 復(fù)制延遲: gh-ost 內(nèi)置了心跳機制,可以指定不同的從庫,從而對主從的復(fù)制延遲時間進行監(jiān)控,如果達到了設(shè)定的延遲閾值程序會自動進入限速模式。

  • 查詢: 用戶可以可以設(shè)置一個限流SQL,比如 SELECT HOUR(NOW()) BETWEEN 8 and 17  這樣就可以動態(tài)的設(shè)置限流時間。

  • 標示文件: 可以通過創(chuàng)建一個標示文件來讓程序限速,當刪除文件后可以恢復(fù)正常操作。

  • 用戶命令: 可以動態(tài)的連接到 gh-ost (下文會提到) 通過網(wǎng)絡(luò)連接的方式實現(xiàn)限速。

可動態(tài)控制

現(xiàn)在的工具,當執(zhí)行操作的過程中發(fā)現(xiàn)負載上升了,DBA不得不終止操作,重新配置參數(shù),如  chunk-size,然后重新執(zhí)行操作命令,我們發(fā)現(xiàn)這種方式效率非常低。

gh-ost 可以通過 unix socket  文件或者TCP端口(可配置)的方式來監(jiān)聽請求,操作者可以在命令運行后更改相應(yīng)的參數(shù),參考下面的例子:

  • echo throttle | socat - /tmp/gh-ost.sock 打開限速,同樣的,可以使用 no-throttle 來關(guān)閉限流。

  • 改變執(zhí)行參數(shù): chunk-size=1500, max-lag-millis=2000, max-load=Thread_running=30  這些參數(shù)都可以在運行時變更。

可審計

同樣的,使用上文提到的程序接口可以獲取 gh-ost 的狀態(tài)。gh-ost  可以報告當前的進度,主要參數(shù)的配置以及當前服務(wù)器的標示等等。這些信息都可以通過網(wǎng)絡(luò)接口取到,相對于傳統(tǒng)的tail日志的方式要靈活很多。

可測試

因為日志文件和主庫負載關(guān)系不大,因此在從庫上執(zhí)行修改表結(jié)構(gòu)的操作可以更真實的體現(xiàn)出這些操作鎖產(chǎn)生的實際影響。(雖然不是十分理想,后續(xù)我們會做優(yōu)化工作)。

gh-ost 內(nèi)建支持測試功能,通過使用 --test-on-replica 的參數(shù)來指定: 它可以在從庫上進行變更操作,在操作結(jié)束時gh-ost  將會停止復(fù)制,交換表,反向交換表,保留2個表并保持同步,停止復(fù)制??梢栽诳臻e時候測試和比較兩個表的數(shù)據(jù)情況。

這是我們在GitHub的生產(chǎn)環(huán)境中的測試:我們生產(chǎn)環(huán)境中有多個從庫;部分從庫并不是為用戶提供服務(wù)的,而是用來對所有表運行的連續(xù)覆蓋遷移測試。我們生產(chǎn)環(huán)境中的表,小的可能沒有數(shù)據(jù),大的會達到數(shù)百GB,我們只是做個標記,并不會正在的修改表結(jié)構(gòu)(engine=innodb)。當每一個遷移結(jié)束后會停止復(fù)制,我們會對原表和臨時表的數(shù)據(jù)進行完整的checksum確保他們的數(shù)據(jù)一致性。然后我們會恢復(fù)復(fù)制,再去操作下一張表。我們的生產(chǎn)環(huán)境的從庫中已經(jīng)通過  gh-ost 成功的操作了很多表。

值得信賴

上文提到說了這么多,都是為了提高大家對 gh-ost 的信任程度。畢竟在業(yè)界它還是一個新手,類似的工具已經(jīng)存在了很多年了。

在***次試手之前我們建議用戶先在從庫上測試,校驗數(shù)據(jù)的一致性。我們已經(jīng)在從庫上成功的進行了數(shù)以千計的遷移操作。

如果在主庫上使用 gh-ost  用戶可以實時觀察主庫的負載情況,如果發(fā)現(xiàn)負載變化很大,可以通過上文提到的多種形式進行限速,直到負載恢復(fù)正常,然后再通過命令微調(diào)參數(shù),這樣可以動態(tài)的控制操作風(fēng)險。

如果遷移操作開始后預(yù)完成計時間(ETA)顯示要到夜里2點才能完成,結(jié)束時候需要切換表,你是不是要留下來盯著?你可以通過標記文件讓  gh-ost推遲切換操作。gh-ost 會完成行復(fù)制,但并不會切換表,它會持續(xù)的將原表的數(shù)據(jù)更新操作同步到臨時表中。你第二天來到辦公室,刪除標記文件或者通過接口  echo unpostpone 告訴gh-ost開始切換表。我們不想讓我們的軟件把使用者綁住,它應(yīng)該是為我們拜托束縛。

說到 ETA, --exact-rowcount 參數(shù)你可能會喜歡。相對于一條漫長的 SELECT COUNT(*) 語句,gh-ost  會預(yù)估出遷移操作所需要花費的時間,還會根據(jù)當前遷移的工作狀況更新預(yù)估時間。雖然ETA的時間隨時更改,但進度百分比的顯示是準確的。

gh-ost 操作模式

gh-ost  可以同時連接多個服務(wù)器,為了獲取二進制的數(shù)據(jù)流,它會作為一個從庫,將數(shù)據(jù)從一個庫復(fù)制到另外一個。它有各種不同的操作模式,這取決于你的設(shè)置,配置,和要運行遷移環(huán)境。

GitHub開源的MySQL在線更改Schema工具gh-ost是怎樣的

a. 連接到從庫,在主庫做遷移

這是 gh-ost 默認的工作方式。gh-ost 將會檢查從庫狀態(tài),找到集群結(jié)構(gòu)中的主庫并連接,接下來進行遷移操作:

  • 行數(shù)據(jù)在主庫上讀寫

  • 讀取從庫的二進制日志,將變更應(yīng)用到主庫

  • 在從庫收集表格式,字段&索引,行數(shù)等信息

  • 在從庫上讀取內(nèi)部的變更事件(如心跳事件)

  • 在主庫切換表

如果你的主庫的日志格式是 SBR,工具也可以正常工作。但從庫必須啟用二級制日志(log_bin, log_slave_updates) 并且設(shè)置  binlog_format=ROW ( gh-ost 是讀取從庫的二級制文件)。

如果直接在主庫上操作,當然也需要二進制日志格式是RBR。

b. 連接到主庫

如果你沒有從庫,或者不想使用從庫,你可以直接在主庫上操作。gh-ost 將會直接在主庫上進行所有操作。你需要持續(xù)關(guān)注復(fù)制延遲問題。

  • 你的主庫的二進制日志必須是 RBR 格式。

  • 在這個模式中你必須指定 --allow-on-master 參數(shù)

c. 在從庫遷移/測試

該模式會在從庫執(zhí)行遷移操作。gh-ost 會簡單的連接到主庫,此后所有的操作都在從庫執(zhí)行,不會對主庫進行任何的改動。整個操作過程中,gh-ost  將控制速度保證從庫可以及時的進行數(shù)據(jù)同步

  • --migrate-on-replica 表示 gh-ost 會直接在從庫上進行遷移操作。即使在復(fù)制運行階段也可以進行表的切換操作。

  • --test-on-replica 表示  遷移操作只是為了測試在切換之前復(fù)制會停止,然后會進行切換操作,然后在切換回來,你的原始表最終還是原始表。兩個表都會保存下來,復(fù)制操作是停止的。你可以對這兩個表進行一致性檢查等測試操作。

gh-ost at GitHub

我們已經(jīng)在所有線上所有的數(shù)據(jù)庫在線操作中使用了gh-ost  ,我們每天都需要使用它,根據(jù)數(shù)據(jù)庫修改需求,可能每天要運行多次。憑借其審計和控制功能我們已經(jīng)將它集成到了ChatOps流程中。我們的工程師可以清醒的了解到遷移操作的進度,而且可以靈活的控制其行為。

開源

gh-ost 在MIT的許可下發(fā)布到了開源社區(qū)。

雖然gh-ost在使用中很穩(wěn)定,我們還在不斷的完善和改進。我們將其開源也歡迎社會各界的朋友能夠參與和貢獻。隨后我們會發(fā)布 貢獻和建議的頁面。

我們會積極的維護 gh-ost 項目,同時希望廣大的用戶可以嘗試和測試這個工具,我們做了很大努力使之更值得信賴。

看完上述內(nèi)容,你們對GitHub開源的MySQL在線更改Schema工具gh-ost是怎樣的有進一步的了解嗎?如果還想了解更多知識或者相關(guān)內(nèi)容,請關(guān)注創(chuàng)新互聯(lián)行業(yè)資訊頻道,感謝大家的支持。


文章題目:GitHub開源的MySQL在線更改Schema工具gh-ost是怎樣的
網(wǎng)址分享:http://weahome.cn/article/ggesee.html

其他資訊

在線咨詢

微信咨詢

電話咨詢

028-86922220(工作日)

18980820575(7×24)

提交需求

返回頂部