這篇文章主要介紹了MySQL常見slave延遲原因有哪些,具有一定借鑒價(jià)值,感興趣的朋友可以參考下,希望大家閱讀完這篇文章之后大有收獲,下面讓小編帶著大家一起了解一下。
讓客戶滿意是我們工作的目標(biāo),不斷超越客戶的期望值來自于我們對(duì)這個(gè)行業(yè)的熱愛。我們立志把好的技術(shù)通過有效、簡(jiǎn)單的方式提供給客戶,將通過不懈努力成為客戶在信息化領(lǐng)域值得信任、有價(jià)值的長期合作伙伴,公司提供的服務(wù)項(xiàng)目有:申請(qǐng)域名、虛擬空間、營銷軟件、網(wǎng)站建設(shè)、寧鄉(xiāng)網(wǎng)站維護(hù)、網(wǎng)站推廣。
一 序言
在運(yùn)維線上M-M 架構(gòu)的MySQL數(shù)據(jù)庫時(shí),接收的比較多關(guān)于主備延時(shí)的報(bào)警:
check_ins_slave_lag (err_cnt:1)critical-slavelag on ins:3306=39438
相信slave 延遲是MySQL dba 遇到的一個(gè)老生長談的問題了。先來分析一下slave延遲帶來的風(fēng)險(xiǎn)
1. 異常情況下,主從HA無法切換。HA 軟件需要檢查數(shù)據(jù)的一致性,延遲時(shí),主備不一致。
2. 備庫復(fù)制hang會(huì)導(dǎo)致備份失敗(flush tables with read lock會(huì)900s超時(shí))
3. 以 slave 為基準(zhǔn)進(jìn)行的備份,數(shù)據(jù)不是最新的,而是延遲。
二 如何解決
面對(duì)此類問題我們?nèi)绾谓鉀Q ,如何規(guī)避?分析一下導(dǎo)致備庫延遲的幾種原因
1. ROW模式無主鍵、無索引或索引區(qū)分度不高.有如下特征
a. show slave status 顯示position一直沒有變
b. show open tables 顯示某個(gè)表一直是 in_use 為 1
c. show create table 查看表結(jié)構(gòu)可以看到無主鍵,或者無任何索引,或者索引區(qū)分度很差。
解決方法:
a. 找到表區(qū)分度比較高的幾個(gè)字段, 可以使用這個(gè)方法判斷:
select count(*) from xx;
select count(*) from (select distinct xx from xxx) t;
如果2個(gè)查詢count(*)的結(jié)果差不多,說明可以對(duì)這些字段加索引
b. 備庫stop slave;
可能會(huì)執(zhí)行比較久,因?yàn)樾枰貪L事務(wù)。
c. 備庫
set sql_log_bin=0;
alter table xx add key xx(xx);
老的版本slave應(yīng)用binlog時(shí)只會(huì)選擇第一個(gè)索引,需要把新加的索引放在最前面,可以先把老的索引刪掉,建新的索引,再把老的索引建上??梢苑诺揭粋€(gè)sql中執(zhí)行。
d. 備庫start slave
如果是innodb,可以通過show innodb status來查看 rows_inserted,updated,deleted,selected這幾個(gè)指標(biāo)來判斷。
如果每秒修改的記錄數(shù)比較多,說明復(fù)制正在以比較快的速度執(zhí)行。
2 MIXED模式無索引或SQL慢
在從庫上show full processlist 查看到正在執(zhí)行的SQL。
解決方法:
a. SQL比較簡(jiǎn)單, 則檢查是否缺少索引,并添加索引。
b. 另一類是 insert into select from的語句,如果select 里包含group by,多表關(guān)聯(lián),可能效率會(huì)比較低。
這類可以到主庫把binlog_format改成row。
3 主庫上有大事務(wù),導(dǎo)致從庫延時(shí)
現(xiàn)象解析binlog 發(fā)現(xiàn)類似于下圖的情況看
解決方法:
與開發(fā)溝通,增加緩存,異步寫入數(shù)據(jù)庫,減少直接對(duì)db的大量寫入。
4. 主庫寫入頻繁,從庫壓力跟不上導(dǎo)致延時(shí)
此類原因的主要現(xiàn)象是數(shù)據(jù)庫的 IUD 操作非常多,slave由于sql_thread單線程的原因追不上主庫。
解決方法:
a 升級(jí)從庫的硬件配置,比如ssd,fio.
b 使用@丁奇的預(yù)熱工具-relay fetch
在備庫sql線程執(zhí)行更新之前,預(yù)先將相應(yīng)的數(shù)據(jù)加載到內(nèi)存中,并不能提高sql_thread線程執(zhí)行sql的能力,也不能加快io_thread線程讀取日志的速度。
c 使用多線程復(fù)制 阿里MySQL團(tuán)隊(duì)實(shí)現(xiàn)的方案--基于行的并行復(fù)制。
該方案允許對(duì)同一張表進(jìn)行修改的兩個(gè)事務(wù)并行執(zhí)行,只要這兩個(gè)事務(wù)修改了表中的不同的行。這個(gè)方案可以達(dá)到事務(wù)間更高的并發(fā)度,但是局限是必須使用Row格式的binlog。因?yàn)橹挥惺褂? Row格式的binlog才可以知道一個(gè)事務(wù)所修改的行的范圍,而使用Statement格式的binlog只能知道修改的表對(duì)象。
5. 數(shù)據(jù)庫中存在大量myisam表,在備份的時(shí)候?qū)е聅lave 延遲
由于xtrabackup 工具備份到最后會(huì)執(zhí)行flash tables with read lock ,對(duì)數(shù)據(jù)庫進(jìn)行鎖表以便進(jìn)行一致性備份,然后對(duì)于myisam表 鎖,會(huì)阻礙salve_sql_thread 停滯運(yùn)行進(jìn)而導(dǎo)致hang
該問題目前的比較好的解決方式是修改表結(jié)構(gòu)為innodb存儲(chǔ)引擎的表。
三 拓展閱讀
[1] 怎樣解決MySQL數(shù)據(jù)庫主從復(fù)制延遲的問題
[2] 三種MySQL并行復(fù)制方案的分析
[3] 一種MySQL主從同步加速方案-改進(jìn)
[4] MySQL多線程同步MySQL-Transfer介紹
6、如何確認(rèn)真正延遲多少?
seconds_bebind_master這個(gè)參數(shù)不準(zhǔn),有時(shí)顯示為0,但是有數(shù)據(jù)延遲的情況,在stop slave和start slave后,數(shù)據(jù)就同步過來了,因?yàn)閟lave有時(shí)候檢測(cè)網(wǎng)絡(luò)正常失敗,可以使用腳本來實(shí)現(xiàn)監(jiān)控,在salve和master節(jié)點(diǎn)分別部署。
先在兩個(gè)節(jié)點(diǎn)都創(chuàng)建監(jiān)控表
#filename: run_mysql_replication_heartbeat.py
#encoding=gbk
import datetime,time
import os,sys
from public import db
import db_conf
source_folder = db_conf.SOURCE_FOLDER
def init_eviroment_path():
print sys.path
python_path = (source_folder)
for i in python_path:
if i not in sys.path:
sys.path.append(i)
print sys.path
def main():
conn, cursor = db.GetMysqlCursor('update')
cursor.execute("insert into heartbeat (master_datetime,slave_datetime) values(now(),sysdate())")
cursor.close()
conn.close()
if __name__ == '__main__':
init_eviroment_path()
os.system("title MySQL Replication心跳")
count = 1
while True:
main()
print "(%d)%s"%(count,datetime.datetime.now())
count+=1
time.sleep(60)
修改master端的binlog模式為statement(默認(rèn)為mix)
所以這么修改是因?yàn)楸仨毷莝tatement的SQL語句同步模式才行,否則mix下有可能是ROW的結(jié)果數(shù)據(jù)同步模式就不行,這個(gè)我也是通過master>show binlog events才找到這個(gè)原因。
如果要立刻看到結(jié)果,只要把master端的時(shí)間修改一下,例如提前一個(gè)小時(shí),執(zhí)行:
insert into heartbeat (master_datetime,slave_datetime) values(now(),sysdate())在slave上就可以看到類似如下結(jié)果:
感謝你能夠認(rèn)真閱讀完這篇文章,希望小編分享的“mysql常見slave延遲原因有哪些”這篇文章對(duì)大家有幫助,同時(shí)也希望大家多多支持創(chuàng)新互聯(lián),關(guān)注創(chuàng)新互聯(lián)行業(yè)資訊頻道,更多相關(guān)知識(shí)等著你來學(xué)習(xí)!