這篇文章主要講解了“MySQL如何進行優(yōu)化”,文中的講解內(nèi)容簡單清晰,易于學(xué)習(xí)與理解,下面請大家跟著小編的思路慢慢深入,一起來研究和學(xué)習(xí)“MySQL如何進行優(yōu)化”吧!
成都創(chuàng)新互聯(lián)專注為客戶提供全方位的互聯(lián)網(wǎng)綜合服務(wù),包含不限于網(wǎng)站建設(shè)、成都做網(wǎng)站、平安網(wǎng)絡(luò)推廣、重慶小程序開發(fā)、平安網(wǎng)絡(luò)營銷、平安企業(yè)策劃、平安品牌公關(guān)、搜索引擎seo、人物專訪、企業(yè)宣傳片、企業(yè)代運營等,從售前售中售后,我們都將竭誠為您服務(wù),您的肯定,是我們最大的嘉獎;成都創(chuàng)新互聯(lián)為所有大學(xué)生創(chuàng)業(yè)者提供平安建站搭建服務(wù),24小時服務(wù)熱線:028-86922220,官方網(wǎng)址:www.cdcxhl.com
案例背景
案例分析
MySQL 主從結(jié)構(gòu)
案例解答
總結(jié)
假設(shè)你公司面臨雙 11 大促,投入了大量營銷費用用于平臺推廣,這帶來了巨大的流量,如果你是訂單系統(tǒng)的技術(shù)負(fù)責(zé)人,要怎么應(yīng)對突如其來的讀寫流量呢?
這是一個很典型的應(yīng)用場景,我想很多研發(fā)工程師會回答:通過 redis 作為 MySQL 的緩存,然后當(dāng)用戶查看“訂單中心”時,通過查詢訂單緩存,幫助 MySQL 抗住大部分的查詢請求。
應(yīng)用緩存的原則之一是保證緩存命中率足夠高,不然很多請求會穿透緩存,最終打到數(shù)據(jù)庫上。然而在“訂單中心”這樣的場景中,每個用戶的訂單都不同,除非全量緩存數(shù)據(jù)庫訂單信息(又會帶來架構(gòu)的復(fù)雜度),不然緩存的命中率依舊很低。
所以在這種場景下,緩存只能作為數(shù)據(jù)庫的前置保護機制,但是還會有很多流量打到數(shù)據(jù)庫上,并且隨著用戶訂單不斷增多,請求到 MySQL 上的讀寫流量會越來越多,當(dāng)單臺 MySQL 支撐不了大量的并發(fā)請求時,該怎么辦?
互聯(lián)網(wǎng)大部分系統(tǒng)的訪問流量是讀多寫少,讀寫請求量的差距可能達到幾個數(shù)量級,就好比你在京東上的商品的瀏覽量肯定遠大于你的下單量。
所以你要考慮優(yōu)化數(shù)據(jù)庫來抗住高查詢請求,首先要做的就是區(qū)分讀寫流量區(qū),這樣才方便針對讀流量做單獨擴展,這個過程就是流量的“讀寫分離”。
讀寫分離是提升 MySQL 并發(fā)的首選方案,因為當(dāng)單臺 MySQL 無法滿足要求時,就只能用多個具有相同數(shù)據(jù)的 MySQL 實例組成的集群來承擔(dān)大量的讀寫請求。
MySQL 做讀寫分離的前提,是把 MySQL 集群拆分成“主 + 從”結(jié)構(gòu)的數(shù)據(jù)集群,這樣才能實現(xiàn)程序上的讀寫分離,并且 MySQL 集群的主庫、從庫的數(shù)據(jù)是通過主從復(fù)制實現(xiàn)同步的。
那么面試官會問你“MySQL 集群如何實現(xiàn)主從復(fù)制?” 換一種問法就是“當(dāng)你提交一個事務(wù)到 MySQL 集群后,MySQL 都執(zhí)行了哪些操作?”面試官往往會以該問題為切入點,挖掘你對 MySQL 集群主從復(fù)制原理的理解,然后再模擬一個業(yè)務(wù)場景,讓你給出解決主從復(fù)制問題的架構(gòu)設(shè)計方案。
所以,針對面試官的套路,你要做好以下的準(zhǔn)備:
掌握讀多寫少場景下的架構(gòu)設(shè)計思路,知道緩存不能解決所有問題,“讀寫分離”是提升系統(tǒng)并發(fā)能力的重要手段。
深入了解數(shù)據(jù)庫的主從復(fù)制,掌握它的原理、問題,以及解決方案。
從實踐出發(fā),做到技術(shù)的認(rèn)知抽象,從方法論層面來看設(shè)計。
MySQL 主從復(fù)制的原理無論是“MySQL 集群如何實現(xiàn)主從復(fù)制”還是“當(dāng)你提交一個事務(wù)到 MySQL 集群后,MySQL 集群都執(zhí)行了哪些操作?”面試官主要是問你:MySQL 的主從復(fù)制的過程是怎樣的?
總的來講,MySQL 的主從復(fù)制依賴于 binlog ,也就是記錄 MySQL 上的所有變化并以二進制形式保存在磁盤上。復(fù)制的過程就是將 binlog 中的數(shù)據(jù)從主庫傳輸?shù)綇膸焐稀_@個過程一般是異步的,也就是主庫上執(zhí)行事務(wù)操作的線程不會等待復(fù)制 binlog 的線程同步完成。
為了方便你記憶,我把 MySQL 集群的主從復(fù)制過程梳理成 3 個階段。
寫入 Binlog:主庫寫 binlog 日志,提交事務(wù),并更新本地存儲數(shù)據(jù)。
同步 Binlog:把 binlog 復(fù)制到所有從庫上,每個從庫把 binlog 寫到暫存日志中。
回放 Binlog:回放 binlog,并更新存儲數(shù)據(jù)。
但在面試中你不能簡單地只講這幾個階段,要盡可能詳細地說明主庫和從庫的數(shù)據(jù)同步過程,為的是讓面試官感受到你技術(shù)的扎實程度(詳細過程如下)。
MySQL 主庫在收到客戶端提交事務(wù)的請求之后,會先寫入 binlog,再提交事務(wù),更新存儲引擎中的數(shù)據(jù),事務(wù)提交完成后,返回給客戶端“操作成功”的響應(yīng)。
從庫會創(chuàng)建一個專門的 I/O 線程,連接主庫的 log dump 線程,來接收主庫的 binlog 日志,再把 binlog 信息寫入 relay log 的中繼日志里,再返回給主庫“復(fù)制成功”的響應(yīng)。
從庫會創(chuàng)建一個用于回放 binlog 的線程,去讀 relay log 中繼日志,然后回放 binlog 更新存儲引擎中的數(shù)據(jù),最終實現(xiàn)主從的數(shù)據(jù)一致性。
在完成主從復(fù)制之后,你就可以在寫數(shù)據(jù)時只寫主庫,在讀數(shù)據(jù)時只讀從庫,這樣即使寫請求會鎖表或者鎖記錄,也不會影響讀請求的執(zhí)行。
同時,在讀流量比較大時,你可以部署多個從庫共同承擔(dān)讀流量,這就是“一主多從”的部署方式,你在垂直電商項目中可以用該方式抵御較高的并發(fā)讀流量。另外,從庫也可以作為一個備庫,以避免主庫故障導(dǎo)致的數(shù)據(jù)丟失。
當(dāng)然,一旦你提及“一主多從”,面試官很容易設(shè)陷阱問你:那大促流量大時,是不是只要多增加幾臺從庫,就可以抗住大促的并發(fā)讀請求了?
當(dāng)然不是。
因為從庫數(shù)量增加,從庫連接上來的 I/O 線程也比較多,主庫也要創(chuàng)建同樣多的 log dump 線程來處理復(fù)制的請求,對主庫資源消耗比較高,同時還受限于主庫的網(wǎng)絡(luò)帶寬。所以在實際使用中,一個主庫一般跟 2~3 個從庫(1 套數(shù)據(jù)庫,1 主 2 從 1 備主),這就是一主多從的 MySQL 集群結(jié)構(gòu)。
其實,你從 MySQL 主從復(fù)制過程也能發(fā)現(xiàn),MySQL 默認(rèn)是異步模式:MySQL 主庫提交事務(wù)的線程并不會等待 binlog 同步到各從庫,就返回客戶端結(jié)果。這種模式一旦主庫宕機,數(shù)據(jù)就會發(fā)生丟失。
而這時,面試官一般會追問你“MySQL 主從復(fù)制還有哪些模型?”主要有三種。
同步復(fù)制:事務(wù)線程要等待所有從庫的復(fù)制成功響應(yīng)。
異步復(fù)制:事務(wù)線程完全不等待從庫的復(fù)制成功響應(yīng)。
半同步復(fù)制:MySQL 5.7 版本之后增加的一種復(fù)制方式,介于兩者之間,事務(wù)線程不用等待所有的從庫復(fù)制成功響應(yīng),只要一部分復(fù)制成功響應(yīng)回來就行,比如一主二從的集群,只要數(shù)據(jù)成功復(fù)制到任意一個從庫上,主庫的事務(wù)線程就可以返回給客戶端。
這種半同步復(fù)制的方式,兼顧了異步復(fù)制和同步復(fù)制的優(yōu)點,即使出現(xiàn)主庫宕機,至少還有一個從庫有最新的數(shù)據(jù),不存在數(shù)據(jù)丟失的風(fēng)險。
講到這兒,你基本掌握了 MySQL 主從復(fù)制的原理,但如果面試官想挖掘你的架構(gòu)設(shè)計能力,還會從架構(gòu)設(shè)計上考察你怎么解決 MySQL 主從復(fù)制延遲的問題,比如問你“在系統(tǒng)設(shè)計上有哪些方案可以解決主從復(fù)制的延遲問題?”
我們來結(jié)合實際案例設(shè)計一個主從復(fù)制延遲的解決方案。
在電商平臺,每次用戶發(fā)布商品評論時,都會先調(diào)用評論審核,目的是對用戶發(fā)布的商品評論進行如言論監(jiān)控、圖片鑒黃等操作。
評論在更新完主庫后,商品發(fā)布模塊會異步調(diào)用審核模塊,并把評論 ID 傳遞給審核模塊,然后再由評論審核模塊用評論 ID 查詢從庫中獲取到完整的評論信息。此時如果主從數(shù)據(jù)庫存在延遲,在從庫中就會獲取不到評論信息,整個流程就會出現(xiàn)異常。
主從延遲影響評論讀取的實時性
這是主從復(fù)制延遲導(dǎo)致的查詢異常,解決思路有很多,我提供給你幾個方案。
使用數(shù)據(jù)冗余
可以在異步調(diào)用審核模塊時,不僅僅發(fā)送商品 ID,而是發(fā)送審核模塊需要的所有評論信息,借此避免在從庫中重新查詢數(shù)據(jù)(這個方案簡單易實現(xiàn),推薦你選擇)。但你要注意每次調(diào)用的參數(shù)大小,過大的消息會占用網(wǎng)絡(luò)帶寬和通信時間。
使用緩存解決
可以在寫入數(shù)據(jù)主庫的同時,把評論數(shù)據(jù)寫到 Redis 緩存里,這樣其他線程再獲取評論信息時會優(yōu)先查詢緩存,也可以保證數(shù)據(jù)的一致性。
不過這種方式會帶來緩存和數(shù)據(jù)庫的一致性問題,比如兩個線程同時更新數(shù)據(jù),操作步驟如下:
線程 A 先更新數(shù)據(jù)庫為 100,此時線程 B 把數(shù)據(jù)庫和緩存中的數(shù)據(jù)都更新成了 200,然后線程 A 又把緩存更新為 100,這樣數(shù)據(jù)庫中的值 200 和緩存中的值 100 就不一致了。
總的來說,通過緩存解決 MySQL 主從復(fù)制延遲時,會出現(xiàn)數(shù)據(jù)庫與緩存數(shù)據(jù)不一致的情況。
直接查詢主庫
該方案在使用時一定要謹(jǐn)慎,你要提前明確查詢的數(shù)據(jù)量不大,不然會出現(xiàn)主庫寫請求鎖行,影響讀請求的執(zhí)行,最終對主庫造成比較大的壓力。
當(dāng)然了,面試官除了從架構(gòu)上考察你對 MySQL主從復(fù)制延遲的理解,還會問你一些擴展問題,比如:當(dāng) MySQL 做了主從分離后,對于數(shù)據(jù)庫的使用方式就發(fā)生了變化,以前只需要使用一個數(shù)據(jù)庫地址操作數(shù)據(jù)庫,現(xiàn)在卻要使用一個主庫地址和多個從庫地址,并且還要區(qū)分寫入操作和查詢操作,那從工程代碼上設(shè)計,怎么實現(xiàn)主庫和從庫的數(shù)據(jù)訪問呢?
實現(xiàn)主庫和從庫的數(shù)據(jù)庫訪問
一種簡單的做法是:提前把所有數(shù)據(jù)源配置在工程中,每個數(shù)據(jù)源對應(yīng)一個主庫或者從庫,然后改造代碼,在代碼邏輯中進行判斷,將 SQL 語句發(fā)送給某一個指定的數(shù)據(jù)源來處理。
這個方案簡單易實現(xiàn),但 SQL 路由規(guī)則侵入代碼邏輯,在復(fù)雜的工程中不利于代碼的維護。
另一個做法是:獨立部署的代理中間件,如 MyCat,這一類中間件部署在獨立的服務(wù)器上,一般使用標(biāo)準(zhǔn)的 MySQL 通信協(xié)議,可以代理多個數(shù)據(jù)庫。
該方案的優(yōu)點是隔離底層數(shù)據(jù)庫與上層應(yīng)用的訪問復(fù)雜度,比較適合有獨立運維團隊的公司選型;缺陷是所有的 SQL 語句都要跨兩次網(wǎng)絡(luò)傳輸,有一定的性能損耗,再就是運維中間件是一個專業(yè)且復(fù)雜的工作,需要一定的技術(shù)沉淀。
我們先從一個案例出發(fā),了解了在互聯(lián)網(wǎng)流量讀多寫少的情況下,需要通過“讀寫分離”提升系統(tǒng)的并發(fā)能力,又因為“讀寫分離”的前提是做 “主+從”的數(shù)據(jù)集群架構(gòu),所以我們又講了主從復(fù)制的原理,以及怎么解決主從復(fù)制帶來的延遲。
感謝各位的閱讀,以上就是“MySQL如何進行優(yōu)化”的內(nèi)容了,經(jīng)過本文的學(xué)習(xí)后,相信大家對MySQL如何進行優(yōu)化這一問題有了更深刻的體會,具體使用情況還需要大家實踐驗證。這里是創(chuàng)新互聯(lián),小編將為大家推送更多相關(guān)知識點的文章,歡迎關(guān)注!