MySQL 的 Binlog 記錄著 MySQL 數(shù)據(jù)庫的所有變更信息,了解 Binlog 的結(jié)構(gòu)可以幫助我們解析Binlog,甚至對(duì) Binlog 進(jìn)行一些修改,或者說是“篡改”,例如實(shí)現(xiàn)類似于 Oracle 的 flashback 的功能,恢復(fù)誤刪除的記錄,把 update 的記錄再還原回去等。本文將帶您探討一下這些神奇功能的實(shí)現(xiàn),您會(huì)發(fā)現(xiàn)比您想象地要簡單得多。本文指的 Binlog 是 ROW 模式的 Binlog,這也是 MySQL 8 里的默認(rèn)模式,STATEMENT 模式因?yàn)槭褂弥杏泻芏嘞拗疲F(xiàn)在用得越來越少了。
創(chuàng)新互聯(lián)長期為成百上千客戶提供的網(wǎng)站建設(shè)服務(wù),團(tuán)隊(duì)從業(yè)經(jīng)驗(yàn)10年,關(guān)注不同地域、不同群體,并針對(duì)不同對(duì)象提供差異化的產(chǎn)品和服務(wù);打造開放共贏平臺(tái),與合作伙伴共同營造健康的互聯(lián)網(wǎng)生態(tài)環(huán)境。為安康企業(yè)提供專業(yè)的成都網(wǎng)站設(shè)計(jì)、做網(wǎng)站,安康網(wǎng)站改版等技術(shù)服務(wù)。擁有10余年豐富建站經(jīng)驗(yàn)和眾多成功案例,為您定制開發(fā)。
Binlog 由事件(event)組成,請(qǐng)注意是事件(event)不是事務(wù)(transaction),一個(gè)事務(wù)可以包含多個(gè)事件。事件描述對(duì)數(shù)據(jù)庫的修改內(nèi)容。
現(xiàn)在我們已經(jīng)了解了 Binlog 的結(jié)構(gòu),我們可以試著修改 Binlog 里的數(shù)據(jù)。例如前面舉例的 Binlog 刪除了一條記錄,我們可以試著把這條記錄恢復(fù),Binlog 里面有個(gè)刪除行(DELETE_ROWS_EVENT)的事件,就是這個(gè)事件刪除了記錄,這個(gè)事件和寫行(WRITE_ROWS_EVENT)的事件的數(shù)據(jù)結(jié)構(gòu)是完全一樣的,只是刪除行事件的類型是 32,寫行事件的類型是 30,我們把對(duì)應(yīng)的 Binlog 位置的 32 改成 30 即可把已經(jīng)刪除的記錄再插入回去。從前面的 “show binlog events” 里面可看到這個(gè) DELETE_ROWS_EVENT 是從位置 378 開始的,這里的位置就是 Binlog 文件的實(shí)際位置(以字節(jié)為單位)。從事件(event)的結(jié)構(gòu)里面可以看到 type_code 是在 event 的第 5 個(gè)字節(jié),我們寫個(gè) Python 小程序把把第383(378+5=383)字節(jié)改成 30 即可。當(dāng)然您也可以用二進(jìn)制編輯工具來改。
找出 Binlog 中的大事務(wù)
由于 ROW 模式的 Binlog 是每一個(gè)變更都記錄一條日志,因此一個(gè)簡單的 SQL,在 Binlog 里可能會(huì)產(chǎn)生一個(gè)巨無霸的事務(wù),例如一個(gè)不帶 where 的 update 或 delete 語句,修改了全表里面的所有記錄,每條記錄都在 Binlog 里面記錄一次,結(jié)果是一個(gè)巨大的事務(wù)記錄。這樣的大事務(wù)經(jīng)常是產(chǎn)生麻煩的根源。我的一個(gè)客戶有一次向我抱怨,一個(gè) Binlog 前滾,滾了兩天也沒有動(dòng)靜,我把那個(gè) Binlog 解析了一下,發(fā)現(xiàn)里面有個(gè)事務(wù)產(chǎn)生了 1.4G 的記錄,修改了 66 萬條記錄!下面是一個(gè)簡單的找出 Binlog 中大事務(wù)的 Python 小程序,我們知道用 mysqlbinlog 解析的 Binlog,每個(gè)事務(wù)都是以 BEGIN 開頭,以 COMMIT 結(jié)束。我們找出 BENGIN 前面的 “# at” 的位置,檢查 COMMIT 后面的 “# at” 位置,這兩個(gè)位置相減即可計(jì)算出這個(gè)事務(wù)的大小,下面是這個(gè) Python 程序的例子。
切割 Binlog 中的大事務(wù)
對(duì)于大的事務(wù),MySQL 會(huì)把它分解成多個(gè)事件(注意一個(gè)是事務(wù) TRANSACTION,另一個(gè)是事件 EVENT),事件的大小由參數(shù) binlog-row-event-max-size 決定,這個(gè)參數(shù)默認(rèn)是 8K。因此我們可以把若干個(gè)事件切割成一個(gè)單獨(dú)的略小的事務(wù)
ROW 模式下,即使我們只更新了一條記錄的其中某個(gè)字段,也會(huì)記錄每個(gè)字段變更前后的值,這個(gè)行為是 binlog_row_image 參數(shù)控制的,這個(gè)參數(shù)有 3 個(gè)值,默認(rèn)為 FULL,也就是記錄列的所有修改,即使字段沒有發(fā)生變更也會(huì)記錄。這樣我們就可以實(shí)現(xiàn)類似 Oracle 的 flashback 的功能,我個(gè)人估計(jì) MySQL 未來的版本從可能會(huì)基于 Binlog 推出這樣的功能。
了解了 Binlog 的結(jié)構(gòu),再加上 Python 這把瑞士軍刀,我們還可以實(shí)現(xiàn)很多功能,例如我們可以統(tǒng)計(jì)哪個(gè)表被修改地最多?我們還可以把 Binlog 切割成一段一段的,然后再重組,可以靈活地進(jìn)行 MySQL 數(shù)據(jù)庫的修改和遷移等工作。
建議你使用union all 關(guān)鍵字
select?xxx?from?table
union?all
select?xxx?from?table
....
update table tableA set tableA.a = (select tableB.b from table tableB where tableA.id = tableB.id)