騰訊云數(shù)據(jù)庫(kù)國(guó)產(chǎn)數(shù)據(jù)庫(kù)專題線上技術(shù)沙龍正在火熱進(jìn)行中,3月5日林曉斌(丁奇)的2020首場(chǎng)分享已經(jīng)結(jié)束,沒(méi)來(lái)得及參與的小伙伴不用擔(dān)心,下面就給大家奉上直播視頻全程回顧,流量傷不起的小伙伴們也可以看由騰訊云數(shù)據(jù)庫(kù)整理好的文字稿,干貨滿滿,保證讓你有所收獲。
公司主營(yíng)業(yè)務(wù):網(wǎng)站設(shè)計(jì)、成都網(wǎng)站建設(shè)、移動(dòng)網(wǎng)站開(kāi)發(fā)等業(yè)務(wù)。幫助企業(yè)客戶真正實(shí)現(xiàn)互聯(lián)網(wǎng)宣傳,提高企業(yè)的競(jìng)爭(zhēng)能力。創(chuàng)新互聯(lián)是一支青春激揚(yáng)、勤奮敬業(yè)、活力青春激揚(yáng)、勤奮敬業(yè)、活力澎湃、和諧高效的團(tuán)隊(duì)。公司秉承以“開(kāi)放、自由、嚴(yán)謹(jǐn)、自律”為核心的企業(yè)文化,感謝他們對(duì)我們的高要求,感謝他們從不同領(lǐng)域給我們帶來(lái)的挑戰(zhàn),讓我們激情的團(tuán)隊(duì)有機(jī)會(huì)用頭腦與智慧不斷的給客戶帶來(lái)驚喜。創(chuàng)新互聯(lián)推出千陽(yáng)免費(fèi)做網(wǎng)站回饋大家。關(guān)注“騰訊云數(shù)據(jù)庫(kù)”公眾號(hào),回復(fù)“0305丁奇”,即可下載直播分享PPT。
點(diǎn)擊查看完整直播回放
大家好!我是騰訊云數(shù)據(jù)庫(kù)的林曉斌,在社區(qū)活動(dòng)的時(shí)候網(wǎng)名叫丁奇,跟比較多的同學(xué)互相認(rèn)識(shí),今天跟大家就是找個(gè)機(jī)會(huì)聊一下數(shù)據(jù)庫(kù)的基礎(chǔ),還有騰訊自研數(shù)據(jù)庫(kù)的技術(shù)演進(jìn),我相信來(lái)聽(tīng)的同學(xué)應(yīng)該都是對(duì)數(shù)據(jù)庫(kù)都比較熟悉,前面的內(nèi)容會(huì)比較快地過(guò),主要還是講我對(duì)數(shù)據(jù)庫(kù)典型架構(gòu)的一些理解,當(dāng)然我知道MySQL的分享有很多,所以今天的大部分內(nèi)容可能很多人都比較熟了,但是如果有一兩個(gè)點(diǎn),你覺(jué)得好像是個(gè)新東西,我覺(jué)得我們就成功了。
首先先說(shuō)數(shù)據(jù)庫(kù)的基本概念,實(shí)際上其實(shí)如果我們只是要一個(gè)數(shù)據(jù)庫(kù)的話,數(shù)據(jù)庫(kù)就是拿來(lái)存東西的,存跟取就是它的基本功能。
在這里可以舉一個(gè)暴露年齡的例子——就是我21世紀(jì)初讀大學(xué)的時(shí)候,給老師課程網(wǎng)站和外面公司做信息管理系統(tǒng)都用的是Access,那個(gè)時(shí)候就覺(jué)得只要我會(huì)建了索引數(shù)據(jù)庫(kù)就都掌握了,數(shù)據(jù)庫(kù)挺簡(jiǎn)單的。當(dāng)然后面事實(shí)證明是我自己太簡(jiǎn)單了,后來(lái)工作有機(jī)會(huì)接觸Oracle和MySQL這些工業(yè)數(shù)據(jù)庫(kù),才算是知道了什么是真正的數(shù)據(jù)庫(kù)。
實(shí)際上我們說(shuō)數(shù)據(jù)庫(kù)發(fā)展到現(xiàn)在,一直會(huì)有這么幾個(gè)挑戰(zhàn)——可靠性、可用性、安全性、性能和成本等,因?yàn)榻裉鞎r(shí)間的關(guān)系也很難全部講,所以今天我們就講一個(gè)點(diǎn)—— 性能。
那么性能的問(wèn)題是怎么來(lái)的?
如果數(shù)據(jù)量很小,訪問(wèn)量也很小,其實(shí)一個(gè)Access就夠了,甚至如果更小一點(diǎn),搞不好一個(gè)Excel就夠了是吧?實(shí)際上真正給性能問(wèn)題帶來(lái)挑戰(zhàn)的,主要是以下3個(gè)方面的原因:
1.大數(shù)據(jù)量。數(shù)據(jù)量特別大,存跟取影響了性能;
2.大并發(fā)。比如有很多個(gè)請(qǐng)求或者很多個(gè)客戶端一起來(lái)訪問(wèn);
3.讀寫模式。讀寫模式什么意思呢?雖然是同一份數(shù)據(jù),但是我們?cè)诓樵兊臅r(shí)候,會(huì)有不同的查詢需求,比如說(shuō)以前論壇的帖子列表,如果你只是按順序顯示出來(lái),那是比較簡(jiǎn)單的;如果你要在里面搜東西那會(huì)難一點(diǎn);如果你還要做一些統(tǒng)計(jì)和做一些分析,那就更難了。不同的讀模式,對(duì)數(shù)據(jù)庫(kù)的查詢壓力是不同的。越復(fù)雜的,比如剛才說(shuō)的搜索或者說(shuō)分析等這樣的操作本身對(duì)數(shù)據(jù)庫(kù)的讀的壓力就跟普通的按行讀取不一樣,所以這些是我們真正需要去解決的數(shù)據(jù)庫(kù)性能問(wèn)題。
說(shuō)到這里就需要談到MySQL的基本架構(gòu),它在解決不同的讀寫模式上面剛好有優(yōu)勢(shì)。下面這個(gè)圖大家應(yīng)該比較熟悉了,這是MySQL的基本架構(gòu)。MySQL是分成上下兩層的,上面這個(gè)框我們叫做server層,就是服務(wù)器層,負(fù)責(zé)跟客戶端做連接,做分析器、優(yōu)化器、執(zhí)行器,下面會(huì)分成多種類型的引擎,這是MySQL相比于其它的數(shù)據(jù)庫(kù)特有的一個(gè)特性, 可以接不同的引擎,每一種引擎可以設(shè)定自己的讀寫存取模式和索引的構(gòu)建方式,來(lái)應(yīng)對(duì)不同的查詢需求。
常見(jiàn)的MySQL引擎有很多,比如說(shuō)MyISAM,就是MySQL原生的一個(gè)引擎,在MySQL5.5之前是默認(rèn)的存儲(chǔ)引擎,但是它的問(wèn)題是不支持事務(wù),也不支持crash-safe,就是主機(jī)斷電的時(shí)候可能會(huì)丟數(shù)據(jù),所以后面用得越來(lái)越少了。
Innodb現(xiàn)在是最主流的關(guān)系數(shù)據(jù)庫(kù)引擎,它解決了什么問(wèn)題呢?首先它能支持事務(wù)的ACID特性,也支持崩潰恢復(fù),所以變成現(xiàn)在最主流的MySQL引擎了。
Memory引擎用得也挺多的,早期版本Innodb的性能還沒(méi)那么好的時(shí)候,我們有時(shí)候會(huì)想用內(nèi)存引擎來(lái)替代Innodb,這樣的話可能會(huì)快一點(diǎn)。當(dāng)然我們知道Memory引擎重啟以后數(shù)據(jù)會(huì)丟失,但是有時(shí)候純粹就把它拿來(lái)當(dāng)緩存服務(wù)用,有些公司的dba會(huì)喜歡用Memory,實(shí)際上Innodb發(fā)展到現(xiàn)在,其實(shí)已經(jīng)可以不需要Memory引擎了。數(shù)據(jù)量小的話,放在Innodb里面基本上都是可以全部緩存的。
那寫的能力呢?如果說(shuō)Innodb是磁盤型的,寫的時(shí)候要落盤,其實(shí)性能一方面是現(xiàn)在的SSD硬盤普及也快了,另外一個(gè)很重要的原因是因?yàn)镸emory不支持并發(fā),你看上去單個(gè)線程的讀寫很快,但是如果你有兩個(gè)線程一起要更新同一張表的時(shí)候,它就要排隊(duì),不像Innodb一樣支持行鎖。所以現(xiàn)在從總體看通用的使用場(chǎng)景的話,Memory其實(shí)是不如Innodb的,所以慢慢用的比較少,像騰訊云的CDB現(xiàn)在直接不建議也不允許用戶創(chuàng)建內(nèi)存引擎了。infobright可能也是老玩家才知道的,就是一個(gè)列存引擎,可以做OLAP業(yè)務(wù)的一個(gè)引擎。
blackhole是一個(gè)黑洞引擎,是什么意思呢?只有表結(jié)構(gòu),往里面寫的數(shù)據(jù)都不存,直接就沒(méi)了,也不會(huì)給你訪問(wèn)報(bào)錯(cuò),只會(huì)告訴你執(zhí)行成功,看上去像個(gè)黑洞,一會(huì)我們也會(huì)介紹一下這種引擎的使用場(chǎng)景。
federated是一個(gè)遠(yuǎn)程鏈接的引擎,你在這邊建一個(gè)表,但實(shí)際上數(shù)據(jù)不是存在本地,可以讓你定義數(shù)據(jù)源在哪里,然后到另外一個(gè)地方去取。
還有RocksDB和TokuDB引擎,是基于LSM或者fractal tree,不是基于B+tree的一個(gè)支持事務(wù)的引擎,這兩個(gè)引擎比較明顯的特點(diǎn)是壓縮率比Innodb高,主要原因是壓縮塊比較大,我們知道Innodb里面16K一個(gè)塊來(lái)壓縮的,越大的單位數(shù)據(jù)壓縮效果會(huì)越好,像TokuDB是4M一個(gè)塊來(lái)壓縮的,所以它的壓縮比高,當(dāng)然它帶來(lái)問(wèn)題就是讀的時(shí)候CPU消耗多一點(diǎn)。
比較常見(jiàn)的是這些引擎,當(dāng)然你可能還可以列出別的,但基本上社區(qū)用的比較多的是這一些。
那么MySQL有這種多引擎的架構(gòu),有什么好處?剛才我們說(shuō)了,當(dāng)一個(gè)業(yè)務(wù)既需要TP型的業(yè)務(wù),但是又需要做列存和分析時(shí),如果是換別的數(shù)據(jù)庫(kù),比如說(shuō)postgresql或者Oracle,本身就很難同時(shí)兼容這兩種能力。而MySQL可以不走引擎,我可以表A創(chuàng)建出一個(gè)Innodb表,表B創(chuàng)建一個(gè)infobright表,然后數(shù)據(jù)在里面做同步,以后我如果要做oltp的查詢,就找Innodb表查,AP的查詢就找infobright查,至少它的架構(gòu)可以這么做。有的同學(xué)會(huì)覺(jué)得很奇葩,混合引擎這種是不是很少見(jiàn)?其實(shí)并不是,MySQL天然就這么干的,默認(rèn)的存儲(chǔ)引擎我們現(xiàn)在都用Innodb,實(shí)際上MySQL自己的系統(tǒng)庫(kù)在5.6和5.7及以前的版本都是用的MyISAM,如user表,這個(gè)是存用戶的表、還有存庫(kù)名的表等,其實(shí)就是放在MyISAM里面,所以MySQL本身就在踐行混合引擎,當(dāng)然是需要特別謹(jǐn)慎的。
舉個(gè)例子,比如跨引擎事務(wù)的一致性問(wèn)題。我們知道Innodb是支持事務(wù)的,而MyISAM是不支持的,假設(shè)說(shuō)現(xiàn)在有一個(gè)庫(kù),里面有兩個(gè)表,T1是MyISAM表,T2是Innodb表,如果你分別使用是沒(méi)有問(wèn)題的,如果我們想要事務(wù),begin啟動(dòng)一個(gè)事務(wù),往T1表里面插入一行,再往T2表里插入一行,然后執(zhí)行一個(gè)rollback,我們認(rèn)為既然begin后面沒(méi)有提交,然后最后執(zhí)行的一個(gè)rollback,那就應(yīng)該T1跟T2這兩個(gè)插入都撤銷,這就是事務(wù)的原子性,要么都成功,要么都失敗。
但是因?yàn)镸yISAM不支持事務(wù),也就是說(shuō)insert into T1執(zhí)行完以后,馬上就持久化了,就寫到數(shù)據(jù)里面去了,所以這一個(gè)序列執(zhí)行完成以后,在數(shù)據(jù)庫(kù)里就會(huì)看到T1里的那條數(shù)據(jù)還在,T2里面的這條又不在了,這個(gè)是違反了事務(wù)的原子性規(guī)則的,對(duì),但不是引擎的問(wèn)題,這是因?yàn)槲覀儗懛ū旧碛袉?wèn)題。這樣你也會(huì)更明確知道:原來(lái)事務(wù)的特性是實(shí)現(xiàn)在引擎里的,支持的引擎就支持,不支持的引擎它就只好忽略。我自己之前在應(yīng)用的一些場(chǎng)景里面也用過(guò),同一個(gè)數(shù)據(jù)庫(kù)里面有不同引擎的表是OK的,但是當(dāng)你要用到一些引擎的特性的時(shí)候,像事務(wù),或者說(shuō)savepoint、全文檢索這種比較特殊的特性,或者全文檢索的時(shí)候,就要去關(guān)注引擎到底支不支持,如果不支持那就不能做,不能混用。
這種場(chǎng)景大家可能會(huì)說(shuō)好像用的不太多,我們?cè)倏聪旅孢@個(gè)圖,把Innodb跟infobright放到一起,雖然MySQL天然就支持,但是它有個(gè)問(wèn)題,感覺(jué)看上去不是很專業(yè),還有比如說(shuō)你在infobright上面跑AP的請(qǐng)求,雖然也可以,但是畢竟我們知道它們共用的server層是同一份,這樣的話會(huì)不會(huì)導(dǎo)致它們互相爭(zhēng)強(qiáng)CPU?其實(shí)是會(huì)的,那如果想要想剝離出來(lái)可以怎么做?那就是下面這個(gè)圖。
就是說(shuō)你可以搭建兩個(gè)不同的MySQL實(shí)例,然后主實(shí)例用Innodb引擎。slave實(shí)例用infobright引擎。因?yàn)镸ySQL的主從同步是可以支持跨索引跨引擎的,也就是說(shuō)假設(shè)左邊有一個(gè)表T1,它是Innodb表,而同步過(guò)來(lái),slave上面的T1,手動(dòng)把它改成infobright或者別的引擎的表,這樣是可以同步的。也就是說(shuō)往主庫(kù)里面做增刪改,都可以同步到從庫(kù)的infobright相同的表名里面,之后你要做AP型的查詢,就直接到從庫(kù)這里面來(lái)查,它是列存的,這種OLAP的請(qǐng)求就足夠快,這是其中的一種用法。
另外這種用法其實(shí)還是有比較多的引申版本,比如說(shuō)中間這個(gè)通道,現(xiàn)在圖里面看到我這樣畫,其實(shí)就是MySQL天然的主從同步機(jī)制,當(dāng)然我們可以中間放一個(gè)數(shù)據(jù)傳輸組件DTS,然后從主庫(kù)拉日志到從庫(kù)去應(yīng)用,這個(gè)是類似的,這是一種場(chǎng)景,這種場(chǎng)景下面解決的是什么問(wèn)題?主庫(kù)跟備庫(kù)的數(shù)據(jù)是一樣的,查詢的邏輯不太一樣,需要備庫(kù)提供更強(qiáng)的不同于Innodb的能力,這個(gè)時(shí)候就可以換一個(gè)引擎來(lái)用,這種場(chǎng)景還是偶爾會(huì)見(jiàn)到。
還有另外一個(gè)場(chǎng)景,黑洞引擎有什么用?
我們還是回到圖的左邊,左邊是一樣的,TP這個(gè)業(yè)務(wù)MySQL里面寫,里面是Innodb表,然后傳到從庫(kù)去,從庫(kù)把它改成blackhole引擎。我們剛才說(shuō)到了blackhole引擎只有表結(jié)構(gòu),數(shù)據(jù)寫進(jìn)來(lái)以后數(shù)據(jù)就沒(méi)了,那么你傳過(guò)來(lái)干嘛呢?傳過(guò)來(lái)存binlog。MySQL的機(jī)制是當(dāng)左邊寫了數(shù)據(jù)跟日志以后,如果要同步給從庫(kù)的話,它一定要把binlog傳過(guò)來(lái)給從庫(kù),從庫(kù)收到日志以后做什么事?做兩件事,先把日志存在本地,再把本地的日志拿來(lái)應(yīng)用,應(yīng)用完以后,再?gòu)膸?kù)里面生成出一份相同的日志。如果你把它改成blackhole引擎,那后面那一步就沒(méi)有用了,拿到日志,后面的執(zhí)行就是空?qǐng)?zhí)行, 表雖然沒(méi)有,但是日志還在,那簡(jiǎn)單來(lái)說(shuō)這個(gè)就可以用來(lái)存binlog,這樣話要備份binlog就不需要到主庫(kù)上面去拷了。去主庫(kù)上面拷也不實(shí)時(shí),通過(guò)這種方式就可以實(shí)時(shí)拿到binlog。當(dāng)然現(xiàn)在這只是說(shuō)MySQL天然支持這樣的機(jī)制,實(shí)際上現(xiàn)在社區(qū)也有不少比較優(yōu)秀軟件本身也可以做相同的事情,可以模擬binlogserver的行為,找主庫(kù)要binlog,要完以后也不應(yīng)用,就存在本地,只是說(shuō)如果我們要搭建一個(gè)簡(jiǎn)單的binlog server,就可以讓從庫(kù)用blackhole引擎,其實(shí)用的也還挺多的。
有的同學(xué)說(shuō)這看上去有點(diǎn)傻,還不如用像社區(qū)的那些方案,實(shí)際上如果可以再往前擴(kuò)展一下,還可以想到別的場(chǎng)景,比如說(shuō)我們要做分布式的場(chǎng)景,一般要多個(gè)節(jié)點(diǎn),因?yàn)橐鲞x舉對(duì)吧?比如說(shuō)我們要做跨中心跨城市的高可用集群時(shí)候,集群節(jié)點(diǎn)可能很多,比如說(shuō)在A城市有5個(gè)節(jié)點(diǎn),B城市有4個(gè)節(jié)點(diǎn),9個(gè)跑起來(lái)特別爽,是吧?掛了一個(gè)以后都可以選舉選出來(lái),它有個(gè)問(wèn)題是什么?成本比較高,因?yàn)槟忝總€(gè)地方都要放數(shù)據(jù),這樣的話有沒(méi)有節(jié)約成本的方法?之前也有人踐行過(guò)這樣的方案,就是說(shuō)這9個(gè)節(jié)點(diǎn)也不是真的要那么多數(shù)據(jù),其中有一部分純粹就只是想?yún)⑴c選舉而已,甚至于你自己都不想被選成,只是參與投票而已,那就可以用blackhole引擎,它可以同步數(shù)據(jù)跟大家形成交互,然后參與投票,當(dāng)然它要把自己標(biāo)志成不能被選成主,這樣雖然你有9個(gè)節(jié)點(diǎn)的成本,但實(shí)際上你真正需要的存儲(chǔ)可能只有5個(gè)或者4個(gè)就可以了,其它的用binlog server來(lái)模擬,這個(gè)也是之前有踐行過(guò)的架構(gòu)。
反正在中國(guó)大批量使用MySQL到現(xiàn)在有十二三年了,中間各種各樣的架構(gòu)都出現(xiàn)過(guò)。再說(shuō)到另外一個(gè)場(chǎng)景,誤刪了數(shù)據(jù),然后這時(shí)候你要恢復(fù),恢復(fù)有一種場(chǎng)景是這樣的,假設(shè)這個(gè)庫(kù)里面有業(yè)務(wù)數(shù)據(jù)表A,還有業(yè)務(wù)日志表B,一般來(lái)說(shuō)日志表都比數(shù)據(jù)表比較大很多,因?yàn)橹虚g記了各種流水,我想恢復(fù)出一個(gè)庫(kù),恢復(fù)數(shù)據(jù)是拿昨天的備份恢復(fù)的,然后拿到全量數(shù)據(jù)后應(yīng)用binlog追到我要的時(shí)間點(diǎn)。而如果現(xiàn)在特別著急的想要,又剛好昨天業(yè)務(wù)壓力大,所以日志表的更新量特別大,恢復(fù)出去全量備份以后,接下來(lái)你拿日志不停地應(yīng)用,然后你會(huì)發(fā)現(xiàn)多時(shí)間都在等日志表的回復(fù),因?yàn)槿罩颈砀露?。如果我現(xiàn)在很明確,先暫時(shí)不要日志表,先把這個(gè)數(shù)據(jù)表給恢復(fù)出來(lái),有什么方法?當(dāng)然方法有好多,我只是說(shuō)如果用blackhole可以這么干,你就把日志表給它清空掉,或者說(shuō)移走,然后創(chuàng)建一個(gè)同名的,引擎叫Blackhole的表,放在那邊是一個(gè)空表。接下來(lái)它開(kāi)始追日志,它的好處是現(xiàn)在日志表追的特別快,因?yàn)檫@個(gè)引擎的特性是什么?你寫的時(shí)候它就一看我是blackhole引擎,命令過(guò)來(lái),就直接跳過(guò),這樣應(yīng)用就非??欤@樣話你就可以快速達(dá)到恢復(fù)數(shù)據(jù)表的目的。所以支持引擎其實(shí)還是有點(diǎn)有趣的,雖然說(shuō)它不是主流的應(yīng)用,但在單機(jī)的MySQL里面支持這樣的能力。
我們接著往下說(shuō)MySQL的高可用架構(gòu),大家都知道怎么做高可用,一般是一主兩備或者至少一主一備,然后往主庫(kù)寫,主庫(kù)掛了就切到從庫(kù)去。從左邊切到右邊就實(shí)現(xiàn)了一個(gè)HA,除非AB兩個(gè)一起掛,運(yùn)氣不好,但是概率小很多。如果一臺(tái)機(jī)器掛了是千分之一的概率,兩個(gè)一起掛就是百萬(wàn)分之一的概率,這個(gè)已經(jīng)很小了,所以一般是這么做的。然后A跟B之間比較主流的實(shí)現(xiàn)會(huì)設(shè)置成互為雙組,這樣話切換的時(shí)候快一點(diǎn),你只要把客戶當(dāng)成左邊切到右邊就可以了,這是典型的MySQL的高可用架構(gòu),但這個(gè)不是我們今天描述的重點(diǎn),只是說(shuō)我們后面要講的時(shí)候,每講一個(gè)數(shù)據(jù)庫(kù)節(jié)點(diǎn)的時(shí)候,它默認(rèn)是帶著主從。
我們還是回到性能這個(gè)問(wèn)題,我們?cè)趺唇鉀Q讀性能的問(wèn)題?加機(jī)器!DBA的核心技能兩點(diǎn),第一個(gè)是重啟,第二個(gè)是加機(jī)器。(笑)
那么加機(jī)器加成什么樣的?我們看到一主好多從,圖中除了A跟A′是用來(lái)做主備做高可用的以外,像BCD本身沒(méi)有業(yè)務(wù)直接給它們寫數(shù)據(jù),但是是從A這個(gè)節(jié)點(diǎn)里面把數(shù)據(jù)同步過(guò)來(lái)的,就是你寫一份A它會(huì)同步給A′做高可用,同時(shí)同步給BCD,BCD拿到日志應(yīng)用完以后,我們認(rèn)為BCD的數(shù)據(jù)跟A是一樣的,接下來(lái)客戶端就可以來(lái)找BCD來(lái)讀了。這樣如果A撐不住讀壓力,可以把讀請(qǐng)求分流分給BCD,這算是比較樸素的方案,在騰訊云MySQL里面有功能叫做RO組,比如說(shuō)我現(xiàn)在有三個(gè)只讀實(shí)例,三個(gè)只讀節(jié)點(diǎn),如果再創(chuàng)建一個(gè),客戶端得改配置。實(shí)際上一般云服務(wù)都會(huì)提供這種能力, 把這些只讀實(shí)例設(shè)置成一個(gè)RO組,接著它們共享同一個(gè)訪問(wèn)方式,或者同一個(gè)域名,或同一個(gè)IP,接下來(lái)寫只要寫一個(gè),讀也只要讀一個(gè),RO組會(huì)幫你做查詢的輪巡和流量的分擔(dān)。
但有的同學(xué)說(shuō)看著還是麻煩,寫和讀難道就不能也湊成同一個(gè)IP嗎?這樣我還得知道寫是寫哪個(gè),讀是讀哪一組,讀跟寫畢竟兩個(gè)IP,有沒(méi)有偷懶加機(jī)器的方法或者說(shuō)透明加機(jī)器的方法?有!就是下面可以加個(gè)proxy。
下面加一個(gè)中間層以后其實(shí)底層的架構(gòu)是一樣的,只是說(shuō)往proxy里面訪問(wèn)的時(shí)候,proxy幫你做分流,如果是一個(gè)寫操作發(fā)給主庫(kù),如果是讀操作發(fā)給下面其他讀節(jié)點(diǎn),所以本質(zhì)上是差不多的,好處就是你可以省得自己去管了,并且也不需要考慮擴(kuò)容。
比如說(shuō)騰訊的TDSQL就支持這個(gè)讀寫分離的模式,你要加節(jié)點(diǎn)的話,你也不用管了,就是下發(fā)一個(gè)加節(jié)點(diǎn)的需求,內(nèi)部它自己幫你復(fù)制出一個(gè)E節(jié)點(diǎn),然后把數(shù)據(jù)全量的恢復(fù)完以后追日志,然后再跟A建立主從關(guān)系等等,做完以后你就做了一個(gè)節(jié)點(diǎn)了,這種方式可以解決我們的讀性能問(wèn)題,那讀性能解決了,寫性能怎么辦?我們看到剛才這兩種模式,它們有個(gè)共同的特點(diǎn)——讀是可以讀好多個(gè),能寫只能寫一個(gè),如果寫A撐不住了怎么辦?分庫(kù)分表。所以我們說(shuō) 寫性能就只能靠分布分表了,TDSQL也支持分庫(kù)分表的模式,就是你寫下來(lái),然后做路由,當(dāng)然這個(gè)路由要事先和數(shù)據(jù)庫(kù)約定好分表的方式和分片的方式,比如說(shuō)創(chuàng)建一個(gè)表,然后用戶ID取模,這樣的方式也是比較常見(jiàn)的分庫(kù)分表的模式。
現(xiàn)在還有一些比如計(jì)算存儲(chǔ)分離等模式,思路其實(shí)是差不多的,都是用來(lái)解決同一個(gè)問(wèn)題,就是通過(guò)水平擴(kuò)展節(jié)點(diǎn)的方式來(lái)分?jǐn)傋x壓力或者寫壓力,然后提升我們整個(gè)系統(tǒng)的吞吐量。但是實(shí)際上MySQL也不是全能的,其實(shí)你想了各種方案,但是還是有支持不了的場(chǎng)景的。
舉個(gè)例子,比如說(shuō)OLAP就不支持,像剛我們說(shuō)的infobright還可以,但實(shí)際上infobright現(xiàn)在用的也不是那么多,真的做OLAP實(shí)際上是有專門的系統(tǒng)來(lái)做的,一會(huì)兒我們可以舉一個(gè)例子。
像圖這種關(guān)系數(shù)據(jù)庫(kù),比如說(shuō)MySQL,我們大家都知道是標(biāo)準(zhǔn)的二維表,要描述一個(gè)圖只能用這種遞歸查詢的方法,性能天然就有問(wèn)題,你可以做,所有關(guān)系最后都表達(dá)一個(gè)二維表的關(guān)系,無(wú)非是這個(gè)關(guān)系處理比較蹩腳而已,速度會(huì)慢。
時(shí)序數(shù)據(jù)庫(kù),能不能用一個(gè)InnoDB表來(lái)存時(shí)序表?當(dāng)然也可以,insert從一開(kāi)始往后追加,然后查的時(shí)候也是,讀的時(shí)候也是,從一開(kāi)始往后刪也是,看上去就是一個(gè)先進(jìn)先出的隊(duì)列,可以這么做,但是是浪費(fèi)的,因?yàn)橐粋€(gè)時(shí)序的場(chǎng)景只需要先進(jìn)先出這個(gè)功能,所以InnoDB提供了那么多中間數(shù)據(jù)的讀寫能力,其實(shí)是一個(gè)浪費(fèi),而這種浪費(fèi)體現(xiàn)在時(shí)序數(shù)據(jù)庫(kù)應(yīng)用場(chǎng)景上面來(lái)說(shuō),在最簡(jiǎn)單的場(chǎng)景里,就是性能不行。
還有一個(gè)是搜索,雖然大家也知道最早MyISAM的引擎還支持一些全文檢索,后來(lái)Innodb為了替換掉MyISAM,官方也給Innodb加上了全文檢索的能力,但是據(jù)我所知,也沒(méi)有哪個(gè)公司真的要使用全文搜索能力的時(shí)候會(huì)大批量使用Innodb,而是會(huì)去搭建真正的像ES這樣的全文檢索引擎,圖也是一樣,OLAP有OLAP自己的系統(tǒng),所以MySQL還是有它不適用的場(chǎng)景,核心的原因其實(shí)是數(shù)據(jù)結(jié)構(gòu),我之前在《MySQL實(shí)戰(zhàn)45講》里面跟大家有提到,當(dāng)我們?nèi)?分析要選擇哪一個(gè)數(shù)據(jù)庫(kù)的時(shí)候,核心的點(diǎn)是要先考察數(shù)據(jù)結(jié)構(gòu),如果它是一個(gè)列存的需求,每次查詢可能要查詢一個(gè)一億行,但是我就是要只查詢于其中一列,這種場(chǎng)景特別多,MySQL能不能做?能做,但是MySQL是行存,每次你要取一個(gè)一億行的第一列的時(shí)候,它就必須把那一行全部讀進(jìn)來(lái),然后就浪費(fèi)了很多IO資源和不必要的CPU消耗。這個(gè)時(shí)候如果有一個(gè)專門做列存的,它有一個(gè)文件專門存了這一個(gè)表第一列的數(shù)據(jù),讀的時(shí)候就直接讀出來(lái),就減少了大量的IO消耗跟CPU消耗,這就是數(shù)據(jù)結(jié)構(gòu)帶來(lái)的優(yōu)勢(shì)。
MySQL雖然也支持,也有說(shuō)往MySQL里面加一些引擎來(lái)支持,但是如果我們主流用Innodb,它就不適合做這個(gè)事。還有比如說(shuō)搜索也是,我明明要的是一個(gè)倒排表,可是你非得給我個(gè)關(guān)系數(shù)據(jù)庫(kù),所以它本質(zhì)一樣是一個(gè)數(shù)據(jù)結(jié)構(gòu)的問(wèn)題。我覺(jué)得這樣才好,MySQL就要有這么多不適用的場(chǎng)景,不能有哪個(gè)數(shù)據(jù)庫(kù)可以通吃所有的場(chǎng)景,那樣才麻煩。我們舉個(gè)例子,比如HTAP這種場(chǎng)景,剛才我們前面有個(gè)圖說(shuō)了,我用一個(gè)MySQL加了一個(gè)infobright也可以,但是不是最專業(yè)的,它畢竟還是一個(gè)單機(jī)版,其實(shí)現(xiàn)在比較主流的方式,把這里替換成一個(gè)專門做AP,在AP上面有很強(qiáng)能力的一個(gè)產(chǎn)品,這樣它天然就可以支持,而且中間的比如說(shuō)往這里寫的TP還可以自己寫,然后數(shù)據(jù)傳輸留的通道也可以保持,只是你把下面這個(gè)核換成一個(gè)可以專門支持這種場(chǎng)景能力的產(chǎn)品,比如騰訊云TBase,它就可以專門支持這樣的場(chǎng)景然后來(lái)解決,這樣才好。
做一個(gè)小結(jié),我們雖然只討論了性能問(wèn)題,性能問(wèn)題其實(shí)只是數(shù)據(jù)庫(kù)發(fā)展過(guò)程中碰到的各種復(fù)雜問(wèn)題其中的一個(gè),而且目前看來(lái),甚至于它大多數(shù)時(shí)候不是最嚴(yán)重的,是吧?安全性、可靠性那些才是挺難的。另外,每一個(gè)方案都是妥協(xié)的結(jié)果,讀寫分離看上去很美,實(shí)際上它不能解決寫的問(wèn)題,分庫(kù)分表看上去更美,但是中間proxy往往要處理SQL兼容性的問(wèn)題,因?yàn)槟莻€(gè)時(shí)候你的proxy就需要做很多數(shù)據(jù)本身的操作,就會(huì)碰到語(yǔ)法兼容性的問(wèn)題。數(shù)據(jù)庫(kù)后來(lái)就會(huì)碰到更多的挑戰(zhàn)了,在我看來(lái)接下來(lái)智能化運(yùn)維是重點(diǎn)方向之一,當(dāng)然現(xiàn)在大家基本上也是每個(gè)系統(tǒng)也做到了智能輔助,做到智能輔助就算不錯(cuò)了?,F(xiàn)在業(yè)務(wù)量越來(lái)越大,像我們?cè)谝咔槠陂g支持騰訊會(huì)議的時(shí)候,我們一些智能化的能力會(huì)減少DBA的工作量,并且提升線上的服務(wù)質(zhì)量,DBA的精力可以解放出來(lái)去做更有價(jià)值的事情。
Q1:講講微盟的刪庫(kù)事件?
A1:我覺(jué)得只是微盟這次運(yùn)氣不好,碰到這個(gè)事情比較嚴(yán)重。說(shuō)回我們?cè)隍v訊運(yùn)營(yíng)的服務(wù)過(guò)程中,經(jīng)常碰到這種客戶,需要回滾,恢復(fù)誤刪的數(shù)據(jù)。另外一個(gè)公司,也是比較有名的互聯(lián)網(wǎng)公司最近也碰到一個(gè)誤刪庫(kù)了,那這個(gè)怎么辦?如果你用云數(shù)據(jù)服務(wù),碰到這種情況,之后就是一個(gè)常規(guī)操作,找一下昨天的備份,然后把日志下載再應(yīng)用就行了。有同學(xué)會(huì)說(shuō)你放在云上,我是個(gè)黑客想惡意操作,進(jìn)去把數(shù)據(jù)和備份刪了,你不是一樣蒙圈?其實(shí)實(shí)際上云會(huì)考慮更多的點(diǎn),騰訊云這邊假設(shè)你真的有操作數(shù)據(jù)庫(kù)、生產(chǎn)庫(kù)的權(quán)限,那么或者你可以把庫(kù)刪掉,但是備份是刪不了的。我們的備份有兩種,一個(gè)是定期備份,一個(gè)是用戶主動(dòng)生成的備份,定期備份的備份是不讓刪除的,比如說(shuō)你配置了一天備一次保留7天,你只能把數(shù)據(jù)刪掉,這固定保留7天的備份是不能刪的,如果真的出現(xiàn)了這種情況的時(shí)候,我們會(huì)保證一定能夠恢復(fù)出來(lái)。那我們?cè)趦?nèi)部的工程師會(huì)不會(huì)有這樣的權(quán)限?也沒(méi)有。其實(shí)我們是分開(kāi)的,可以管理生產(chǎn)服務(wù)器的工程師訪問(wèn)不了備份。其實(shí)發(fā)展到現(xiàn)在每個(gè)公司對(duì)數(shù)據(jù)庫(kù)能力的理解不會(huì)差很多,尤其人才流動(dòng),所以各個(gè)公司數(shù)據(jù)庫(kù)的leader其實(shí)我覺(jué)得水平都是差不太多的,而云的一個(gè)好處是以前碰到過(guò)各種突發(fā)情況的訓(xùn)練,通過(guò)不斷迭代,終于構(gòu)建出一個(gè)可以cover住大部分場(chǎng)景問(wèn)題的解決方案。
Q2:TBase是基于PG演進(jìn)出來(lái)的HTAP數(shù)據(jù)庫(kù),為什么不考慮在TDSQL中加入OLAP的能力呢?
A2:TDSQL我們會(huì)考慮,因?yàn)閯偛耪f(shuō)了TDSQL本身上面的框架就可以支持讀寫分離,也可以支持分庫(kù)分表,中間那一層proxy,其實(shí)已經(jīng)可以認(rèn)為它已經(jīng)完全兼容了MySQL的協(xié)議,接下來(lái)下面如果要AP的,其實(shí)換成AP節(jié)點(diǎn)是可以的,實(shí)際上也在我們的路線里面,只是說(shuō)目前還沒(méi)有把它產(chǎn)品化出來(lái),就放到云上而已。
Q3:MySQL的分布分表有哪些成熟的可靠的方案?
A3:其實(shí)我看到最成熟就是找個(gè)維度分表,取決于你的查詢模式。舉個(gè)例子,如果你是做在線教育的,然后假設(shè)你是一個(gè)學(xué)生表,你就按學(xué)生ID或者按學(xué)生城市做這樣的分表,基本上這樣就可以了,我感覺(jué)沒(méi)有很復(fù)雜的點(diǎn)。當(dāng)然你需要解決的問(wèn)題是如果你按城市分的表,按城市分庫(kù),這時(shí)候你要做一個(gè)查詢,這個(gè)查詢要統(tǒng)計(jì)所有9歲學(xué)生的情況,這個(gè)時(shí)候你就不得不給每一個(gè)分庫(kù)下發(fā)查詢,這樣成本消耗比較高,性能會(huì)差一點(diǎn),當(dāng)然對(duì)應(yīng)的有一些解決方案了。你業(yè)務(wù)做了分布分表,假設(shè)一些統(tǒng)計(jì)類的需求,需要做這種不是基于分表索引的查詢的時(shí)候,你可以怎么做?可以有一個(gè)匯總的大庫(kù),要把數(shù)據(jù)匯總回去,大庫(kù)里面就可以建各種索引,具體實(shí)施上可能有差異,大方向上場(chǎng)景就是這類架構(gòu),好像發(fā)展這么多年也沒(méi)有搞出新花樣。
Q4:TDSQL的分庫(kù)分表模式,對(duì)MySQL語(yǔ)法支持如何?
A4:是這樣的,所有只要你用了分布分表模式的,我都會(huì)建議上來(lái)之前一定要做一次業(yè)務(wù)回歸,目前看來(lái)90%以上的客戶都是直接遷上來(lái)就能用,但如果你的語(yǔ)句里面有那種groupby大量數(shù)據(jù)的時(shí)候,其實(shí)也兼容,但是它的性能會(huì)差一點(diǎn),或者說(shuō)性能跟你在本地的時(shí)候不太一樣,這個(gè)時(shí)候就要經(jīng)過(guò)測(cè)試,而兼容性以我們目前的情況來(lái)說(shuō)改造量還是比較小。
Q5:為什么基于中間件的分庫(kù)分表的方案,各家公司很少會(huì)去實(shí)現(xiàn)分布式事務(wù) 和 數(shù)據(jù)resharding ?
A5:不會(huì)啊,我們做得很多啊,實(shí)際上分布事務(wù)我所了解的幾個(gè)大的公司都在做,因?yàn)檫@個(gè)是繞不開(kāi)的,畢竟分布分表是一種方向,而下面的節(jié)點(diǎn)之間做分布式事務(wù)是另外一個(gè)方向,而這個(gè)方向確實(shí)理論挑戰(zhàn)會(huì)更大一點(diǎn),它有它的好處,就是proxy這一層可以做得很輕,甚至于proxy的兼容性問(wèn)題就直接徹底被解決了。然后選主等就可以在底層自己做,實(shí)際上有在做像比如說(shuō)目前在研發(fā)中的TDSQL3.0。我們現(xiàn)在在線上使用的TDSQL2.0其實(shí)就是標(biāo)準(zhǔn)的分庫(kù)分表的方案。
Q6:可以教教調(diào)試MySQL?
A6:調(diào)試MySQL要看碰到什么問(wèn)題,如果是比較簡(jiǎn)單的,比如說(shuō)索引,那比較簡(jiǎn)單,如果說(shuō)是碰到語(yǔ)句都對(duì)但是性能慢的,這種比較偏于操作型的操作。如果是MySQL這種自己調(diào)優(yōu)的話,其實(shí)可以做一些基本的診斷、開(kāi)慢查詢?nèi)罩?,像percona toolkit有一些工具,可以直接跑這個(gè)工具看到結(jié)論。當(dāng)然慢查詢?nèi)罩痉治龃嬖谝粋€(gè)問(wèn)題,可能很多語(yǔ)句不是慢查詢,就是還不到高峰期的時(shí)候,它可能執(zhí)行200ms,一看慢查詢?cè)O(shè)置的是1s,所以會(huì)以為沒(méi)什么問(wèn)題。但是呢,如果壓力一大就撐不住。這個(gè)時(shí)候如果能夠有個(gè)系統(tǒng),把所有的語(yǔ)句執(zhí)行的情況都記錄起來(lái),然后再去做診斷,那肯定比只有慢查詢要好。比如騰訊云MySQL就支持審計(jì)日志,你只要開(kāi)了審計(jì)日志,那里面就會(huì)有所有的信息,當(dāng)然你也可以使用DBbrian直接去診斷一下,看看現(xiàn)在的數(shù)據(jù)庫(kù)里有什么問(wèn)題,一般DBbrain會(huì)告訴你存在什么問(wèn)題,應(yīng)該怎么加索引,可以通過(guò)這種方式去了解為什么要這樣做,了解它的原理。
Q7:TDSQL適用的行業(yè)和場(chǎng)景可以舉例說(shuō)明一下嘛?
A7:MySQL高可用架構(gòu)可以適用很多場(chǎng)景,底層的安全配置也會(huì)在不同的場(chǎng)景不同的應(yīng)用。舉個(gè)例子,比如說(shuō)TDSQL放在游戲里面,可能只要開(kāi)啟一個(gè)異步就可以了,不用開(kāi)全同步,但是像張家港銀行這種案例,TDSQL要放到銀行的核心系統(tǒng)里面去的時(shí)候,能不能用呢,可以。我們有個(gè)配置,必須是全同步,至少一主兩從,數(shù)據(jù)寫進(jìn)去后,另外兩個(gè)節(jié)點(diǎn)都不給我返回,我就不寫了,就會(huì)直接報(bào)錯(cuò),至少有一個(gè)給我反饋說(shuō)成功了,它才會(huì)往里面寫,所以現(xiàn)在像TDSQL,我們是定位在做金融數(shù)據(jù)庫(kù)上面的。那我想用普通的讀寫分離方法,能不能用TDSQL呢?可以,也沒(méi)有問(wèn)題,最后由你來(lái)決定了,比如我不希望當(dāng)有兩個(gè)從節(jié)點(diǎn)都?jí)牧耍筒荒軐?。我希望還是可以正常讀寫,那你可以設(shè)置成退化的異步模式。適用場(chǎng)景還是蠻多的,行業(yè)不限,還是取決于數(shù)據(jù)的定位。
Q8:怎么判斷MySQL當(dāng)前需要分庫(kù)分表?通過(guò)什么參數(shù)可以看到嗎?
A8:一般說(shuō)我們什么時(shí)候需要分庫(kù)分表,第一個(gè)很明顯的,如果你的數(shù)據(jù)量大,撐不住了可以使用,比如說(shuō)一臺(tái)機(jī)器只有10T,但是一個(gè)庫(kù)快滿了,這時(shí)候分庫(kù)分表比較好理解,那如果是空間還沒(méi)到,但是性能撐不住了呢,就可以有幾個(gè)指標(biāo),比如說(shuō)一個(gè)是寫的RT,還有一個(gè)是讀寫的RT,還有一個(gè)是讀的命中率,因?yàn)槲覀冎繫ySQL是B+樹(shù)的結(jié)構(gòu),那如果是層數(shù)比較少的時(shí)候,就是大多數(shù)的索引都在內(nèi)存里,那你每一次查詢都可以在內(nèi)存里完成,最后,隨著數(shù)據(jù)量的增大那是不可能了,所以你有1T的數(shù)據(jù),100G的內(nèi)存,那么會(huì)有十分之一的數(shù)據(jù)直接在內(nèi)存里面,假設(shè)再更大一些,那你的命中率就會(huì)降低,這里有什么參數(shù)可以看呢,就是show engine innodb status這個(gè)命令里面有個(gè)內(nèi)存命中率,你一般看正常線上業(yè)務(wù)的命中率,如果是線上的OLAP,正常的命中率要為99%以上,99.2%、99.3% 這樣才算正常,比如說(shuō)如果掉到了97%、95% 這種,那就可能就要考慮一下了,可能你還沒(méi)有發(fā)現(xiàn)這個(gè)問(wèn)題,業(yè)務(wù)線來(lái)找你了,說(shuō)為什么我的這個(gè)請(qǐng)求慢了。為什么會(huì)出現(xiàn)這種情況呢,就是因?yàn)槲覀冎繧nnoDB是B+tree組織的,你要訪問(wèn)一個(gè)數(shù)據(jù)的時(shí)候,你從樹(shù)根開(kāi)始找,要找好幾層才能找到,找到最下面那個(gè)葉子節(jié)點(diǎn)。雖然現(xiàn)在ssd快了,但是如果IO壓力大了,比如說(shuō)10ms,那你有一次IO加載10ms還好點(diǎn),如果樹(shù)很高,在索引遍歷的過(guò)程中需要去訪問(wèn)磁盤了,那這個(gè)時(shí)候性能就慢下來(lái)了,所以呢,內(nèi)存命中率是一個(gè)比較重要的參考指標(biāo),其實(shí)核心是慢查詢,就是業(yè)務(wù)的反饋。
Q9:您認(rèn)為目前云數(shù)據(jù)庫(kù)的痛點(diǎn)和難點(diǎn)分別是什么呢?
A9:我們分兩塊,先說(shuō)用戶。比如說(shuō)我是一個(gè)用戶,我用云數(shù)據(jù)庫(kù),覺(jué)得首先的痛點(diǎn)就是要提升用戶使用這個(gè)產(chǎn)品的易用性。我是一個(gè)專業(yè)的DBA用這個(gè)數(shù)據(jù)庫(kù)能不能把我的能力發(fā)揮出來(lái),在騰訊云數(shù)據(jù)庫(kù)現(xiàn)在可以看到好多監(jiān)控信息,但是我能不能更多一些?這個(gè)系統(tǒng)有沒(méi)有辦法幫我更多的去提供診斷能力?讓我能夠更快的定位問(wèn)題?然后把精力省下來(lái)去解決我們公司內(nèi)部這種業(yè)務(wù)架構(gòu)問(wèn)題、數(shù)據(jù)架構(gòu)問(wèn)題,把我從一個(gè)DBA變成一個(gè)數(shù)據(jù)架構(gòu)師。
另一部分說(shuō)云服務(wù)商,比如說(shuō)騰訊云現(xiàn)在有很多的客戶,那每個(gè)客戶都來(lái)問(wèn)數(shù)據(jù)庫(kù)為什么慢了,我們團(tuán)隊(duì)那十幾個(gè)DBA同學(xué)早也瘋了,我們系統(tǒng)要有這樣的能力,能夠不只是DBA能解決的了,我們的一線架構(gòu)師、售后甚至客服的同學(xué)用一套工具就能解決大部分的問(wèn)題。有這個(gè)可診斷性,可以能讓很多能力發(fā)揮出來(lái),可以讓后端解放,可以讓一線輕松,然后可以讓我們的客戶有工具了,可以診斷了,可以發(fā)揮個(gè)人的專業(yè)技能。
Q10:除了云數(shù)據(jù)庫(kù)平臺(tái)自己的備份,云主機(jī)自建數(shù)據(jù)庫(kù)的情況,平臺(tái)會(huì)自動(dòng)備份數(shù)據(jù)嗎?
A10:如果你是在云主機(jī)上面,就是虛擬機(jī)上面創(chuàng)建數(shù)據(jù)庫(kù)的話,虛擬機(jī)本身會(huì)有快照備份,但是這個(gè)快照只有點(diǎn)的快照。舉個(gè)例子,我今天下午五點(diǎn)不小心誤刪了數(shù)據(jù),那我拿到今天凌晨12點(diǎn)那個(gè)備份可能不夠用,那我還需要中間的binglog,那這個(gè)時(shí)候呢,你做一個(gè)磁盤級(jí)別的鏡像未必有能力真的精確追到五點(diǎn),如果你用數(shù)據(jù)庫(kù)就沒(méi)有這個(gè)問(wèn)題,因?yàn)槲覀兪翘烊灰詫?shí)例級(jí)別和日志級(jí)別來(lái)備份的數(shù)據(jù)。
Q11:TDSQL考慮加入AP功能,那么TBASE和TDSQL的定位有什么不同?
A11:TDSQL加入AP能力就是看你要解決的問(wèn)題有多大,我舉個(gè)例子,假設(shè)我要在TDSQL加一個(gè)搜索能力,那我除了用Innodb的全文檢索以外,還可以在里面放一個(gè)sphinxSE引擎,后面掛一個(gè)sphinx,也可以跑,但是你說(shuō)我要用它來(lái)支撐,比如說(shuō)這個(gè)騰訊首頁(yè)的搜索,那肯定撐不住。那時(shí)候就需要搭建一個(gè)專門的搜索引擎來(lái)支持。所以我們往TP系統(tǒng)里面加這種能力,它只能是解決跟我TP很接近,但是不需要那么大的計(jì)算量的搜索,我可以支持一下,其實(shí)這種場(chǎng)景使用已經(jīng)很多了,因?yàn)樗幸粋€(gè)好處是數(shù)據(jù)閉環(huán),就是數(shù)據(jù)進(jìn)去TDSQL以后你不用出去,你在這里寫完后,我在這里分析,分析完以后,你直接拿走,這樣用戶的易用性高,但是這個(gè)方案會(huì)這樣設(shè)定為小型的AP系統(tǒng),像這種AP系統(tǒng)場(chǎng)景有很多的,比如你要給老板做一個(gè)報(bào)表,日?qǐng)?bào)啊,運(yùn)營(yíng)分析系統(tǒng)啊,像這種在關(guān)系數(shù)據(jù)TP里面加上AP的能力這是可以的,那你說(shuō)我想把它構(gòu)建成一個(gè)超級(jí)搜索引擎,那就不是來(lái)干這個(gè)的。
Q12:proxy 會(huì)不會(huì)有單點(diǎn)問(wèn)題?
A12:不是一個(gè),其實(shí)可以是有很多個(gè),proxy其實(shí)是最不容易成為單點(diǎn)了,舉個(gè)例子,比如像我們的TDSQL默認(rèn)是三個(gè)proxy,騰訊云Redis默認(rèn)是五個(gè)proxy,實(shí)際上你會(huì)發(fā)現(xiàn)proxy才更好加節(jié)點(diǎn),proxy沒(méi)有狀態(tài),掛了一臺(tái), 我直接找另一把它啟動(dòng)起來(lái)就行了,所以proxy不太會(huì)容易成為單點(diǎn)的。
Q13:TDSQL在一主一備模式下通過(guò)網(wǎng)關(guān)訪問(wèn)數(shù)據(jù)庫(kù),進(jìn)行查詢壓測(cè)時(shí)主節(jié)點(diǎn)的cpu使用率很高 備節(jié)點(diǎn)很低,可能是什么原因?qū)е碌哪兀?/strong>
A13:如果你只有一主一備,你要確認(rèn)一下你的分庫(kù)規(guī)則,你可能把所有的請(qǐng)求都發(fā)給主庫(kù)了,但TDSQL是有監(jiān)控的,你可以看哪個(gè)主節(jié)點(diǎn)和備節(jié)點(diǎn)上面分別查詢的請(qǐng)求,舉個(gè)例子,如果查詢?nèi)谥鞴?jié)點(diǎn),備節(jié)點(diǎn)沒(méi)有,那你可能要配置下你的路由規(guī)則。
Q14:MySQL雙主模型時(shí),數(shù)據(jù)不一致怎么解決?
A14:我每次說(shuō)到這個(gè)就要特別講一下,我們這個(gè)圖里面,說(shuō)的雙主其實(shí)是,你在任何一個(gè)時(shí)刻一邊都是Readonly的,狀態(tài)1的時(shí)候B節(jié)點(diǎn)是Readonly然后狀態(tài)2的時(shí)候A是Readonly,這種就是比較常見(jiàn)的做法,但是有沒(méi)有這種多節(jié)點(diǎn)寫入的方案呢?有幾個(gè),比如說(shuō)像這種方案也可以多寫,也就是說(shuō)客戶端既可以往A寫也可以往B寫,這種如果你用傳統(tǒng)的,比如說(shuō)現(xiàn)在的MySQL的能力,那就要由業(yè)務(wù)方來(lái)保證我寫入的數(shù)據(jù)量?jī)蛇叢粵_突,左邊都寫一個(gè)城市數(shù)據(jù),右邊都寫一個(gè)城市的數(shù)據(jù),然后兩邊去同步,這樣不沖突,這是一種。那當(dāng)然有MRG還有比如Innodb cluster,它自己會(huì)做事務(wù)之間的沖突檢測(cè),據(jù)我了解這個(gè)在國(guó)內(nèi)用的并不多,或者說(shuō)不會(huì)把它當(dāng)為常態(tài)互相寫,畢竟你兩邊寫,即使你能做到兩邊不沖突,但是成本會(huì)很高。每次要寫一個(gè)事務(wù)的時(shí)候,都要去問(wèn)下另外一個(gè)節(jié)點(diǎn)能不能寫,它告訴我能寫才寫,不能寫我就放棄,那這樣的話這個(gè)性能就會(huì)降下來(lái),所以真正多寫的結(jié)構(gòu),據(jù)我了解,有的公司是用在做切換的時(shí)候,當(dāng)我從A切換到B的時(shí)候,比如看圖中架構(gòu),如果我從A切換到B的時(shí)候有一段時(shí)間內(nèi)是不可寫的,我要把A停寫,然后B同步完后,把請(qǐng)求連到B這邊,那如果你可以支持多寫,中間成本會(huì)高些,但是畢竟能寫,這樣的話我就可以同時(shí)往A和B同時(shí)寫,在很短的時(shí)間內(nèi)把A的更新去掉,這樣的業(yè)務(wù)的好處就是,業(yè)務(wù)發(fā)現(xiàn)完全不停機(jī),不停寫,但是也只是用在這么一個(gè)短暫的時(shí)候,它本身天然就與物理規(guī)律有點(diǎn)沖突。
Q15:現(xiàn)在推不推薦上MYSQL8呢?
A15:推薦,已經(jīng)一年多了,我們自己在騰訊云測(cè)試環(huán)境上測(cè)試8.0的性能還是比5.7好不少,所以今年上半年我們應(yīng)該會(huì)推出MySQL8.0的版本。
Q16:原來(lái)業(yè)務(wù)用Oracle,單機(jī)能力很強(qiáng),現(xiàn)在可以用TDSQL或TBase來(lái)替換嗎?
A16:我覺(jué)得ok,把oracle換成MySQL體系,這個(gè)事情呢已經(jīng)經(jīng)過(guò)證明了,能這么做。
Q17:主從復(fù)制是異步的,怎么保證讀取數(shù)據(jù)的一致性?
A17:這是個(gè)大問(wèn)題,因?yàn)榻裉煳覀兇_實(shí)沒(méi)有時(shí)間提到這個(gè),《MySQL實(shí)戰(zhàn)45講》里面有一篇專門講這個(gè)的,有一些方法,比如說(shuō),故意慢一點(diǎn)去讀,或者說(shuō)查詢的時(shí)候有些請(qǐng)求有一定敏感請(qǐng)求放主庫(kù)等有各種方法,還有一些可以用GTID來(lái)解決。
Q18:怎么入門MySQL源碼?
A18:如果你真的想入MySQL源碼的話,你可以這樣,首先你得有一套MySQL源碼下載下來(lái),然后你可以開(kāi)debug日志,執(zhí)行一個(gè)簡(jiǎn)單語(yǔ)句,debug日志會(huì)列出所有調(diào)用的函數(shù),然后你就照著函數(shù)去數(shù)據(jù)庫(kù)源碼里面找下看看在哪里,可以給自己一個(gè)問(wèn)題。舉個(gè)例子,你執(zhí)行一個(gè)select1,當(dāng)然返回的就是1對(duì)不對(duì),你先給自己一個(gè)需求,比如我現(xiàn)在想給它寫一個(gè)bug,這時(shí)候返回2,那我該怎么做,可以試試。當(dāng)然如果你開(kāi)發(fā)功底不錯(cuò)可以考慮我們團(tuán)隊(duì),我們團(tuán)隊(duì)天然干這個(gè)的。
Q19:讀寫分離的話,主從同步延遲很大,讀的是延后的數(shù)據(jù),不是有損傷嗎,一些調(diào)優(yōu)的參數(shù)都試過(guò)了,這時(shí)是不是該分庫(kù)分表了?
A19:如果你的這個(gè)主庫(kù)和從庫(kù)的配置是一樣的,而主庫(kù)有讀寫,從庫(kù)上并沒(méi)有壓力的時(shí)候還有延遲,那很可能是因?yàn)槟愕牟⑿卸炔粔?,就是你可能沒(méi)有開(kāi)啟并行復(fù)制,你可以開(kāi)下并行復(fù)制試下。如果由于對(duì)從庫(kù)的查詢壓力過(guò)大,導(dǎo)致從庫(kù)cpu消耗過(guò)大,導(dǎo)致延遲,這種情況可以多加幾個(gè)從庫(kù),分庫(kù)分表當(dāng)然也是一個(gè)解法。什么情況下說(shuō)需要分庫(kù)分表呢,就是你主庫(kù)更新量太大了,大到MySQL開(kāi)啟了并行復(fù)制都撐不住的時(shí)候,可能需要考慮,這個(gè)話題比較復(fù)雜,大家可以搜一些文章。
直播互動(dòng)福利:每晚直播間也同樣會(huì)送出多份騰訊公仔,更有騰訊徽章、騰訊云代金券等好禮送上!快快預(yù)約報(bào)名吧!
掃碼關(guān)注后回復(fù)「加群」提前加入沙龍交流群