數(shù)據(jù)庫(kù)優(yōu)化一方面是找出系統(tǒng)的瓶頸,提高M(jìn)ySQL數(shù)據(jù)庫(kù)的整體性能,而另一方面需要合理的結(jié)構(gòu)設(shè)計(jì)和參數(shù)調(diào)整,以提高用戶(hù)的相應(yīng)速度,同時(shí)還要盡可能的節(jié)約系統(tǒng)資源,以便讓系統(tǒng)提供更大的負(fù)荷.
成都網(wǎng)絡(luò)公司-成都網(wǎng)站建設(shè)公司創(chuàng)新互聯(lián)建站10余年經(jīng)驗(yàn)成就非凡,專(zhuān)業(yè)從事成都做網(wǎng)站、網(wǎng)站制作,成都網(wǎng)頁(yè)設(shè)計(jì),成都網(wǎng)頁(yè)制作,軟文推廣,一元廣告等。10余年來(lái)已成功提供全面的成都網(wǎng)站建設(shè)方案,打造行業(yè)特色的成都網(wǎng)站建設(shè)案例,建站熱線:028-86922220,我們期待您的來(lái)電!
1. 優(yōu)化一覽圖
2. 優(yōu)化
筆者將優(yōu)化分為了兩大類(lèi),軟優(yōu)化和硬優(yōu)化,軟優(yōu)化一般是操作數(shù)據(jù)庫(kù)即可,而硬優(yōu)化則是操作服務(wù)器硬件及參數(shù)設(shè)置.
2.1 軟優(yōu)化
2.1.1 查詢(xún)語(yǔ)句優(yōu)化
1.首先我們可以用EXPLAIN或DESCRIBE(簡(jiǎn)寫(xiě):DESC)命令分析一條查詢(xún)語(yǔ)句的執(zhí)行信息.
2.例:
顯示:
其中會(huì)顯示索引和查詢(xún)數(shù)據(jù)讀取數(shù)據(jù)條數(shù)等信息.
2.1.2 優(yōu)化子查詢(xún)
在MySQL中,盡量使用JOIN來(lái)代替子查詢(xún).因?yàn)樽硬樵?xún)需要嵌套查詢(xún),嵌套查詢(xún)時(shí)會(huì)建立一張臨時(shí)表,臨時(shí)表的建立和刪除都會(huì)有較大的系統(tǒng)開(kāi)銷(xiāo),而連接查詢(xún)不會(huì)創(chuàng)建臨時(shí)表,因此效率比嵌套子查詢(xún)高.
2.1.3 使用索引
索引是提高數(shù)據(jù)庫(kù)查詢(xún)速度最重要的方法之一,關(guān)于索引可以參高筆者M(jìn)ySQL數(shù)據(jù)庫(kù)索引一文,介紹比較詳細(xì),此處記錄使用索引的三大注意事項(xiàng):
2.1.4 分解表
對(duì)于字段較多的表,如果某些字段使用頻率較低,此時(shí)應(yīng)當(dāng),將其分離出來(lái)從而形成新的表,
2.1.5 中間表
對(duì)于將大量連接查詢(xún)的表可以創(chuàng)建中間表,從而減少在查詢(xún)時(shí)造成的連接耗時(shí).
2.1.6 增加冗余字段
類(lèi)似于創(chuàng)建中間表,增加冗余也是為了減少連接查詢(xún).
2.1.7 分析表,,檢查表,優(yōu)化表
分析表主要是分析表中關(guān)鍵字的分布,檢查表主要是檢查表中是否存在錯(cuò)誤,優(yōu)化表主要是消除刪除或更新造成的表空間浪費(fèi).
1. 分析表: 使用 ANALYZE 關(guān)鍵字,如ANALYZE TABLE user;
2. 檢查表: 使用 CHECK關(guān)鍵字,如CHECK TABLE user [option]
option 只對(duì)MyISAM有效,共五個(gè)參數(shù)值:
3. 優(yōu)化表:使用OPTIMIZE關(guān)鍵字,如OPTIMIZE [LOCAL|NO_WRITE_TO_BINLOG] TABLE user;
LOCAL|NO_WRITE_TO_BINLOG都是表示不寫(xiě)入日志.,優(yōu)化表只對(duì)VARCHAR,BLOB和TEXT有效,通過(guò)OPTIMIZE TABLE語(yǔ)句可以消除文件碎片,在執(zhí)行過(guò)程中會(huì)加上只讀鎖.
2.2 硬優(yōu)化
2.2.1 硬件三件套
1.配置多核心和頻率高的cpu,多核心可以執(zhí)行多個(gè)線程.
2.配置大內(nèi)存,提高內(nèi)存,即可提高緩存區(qū)容量,因此能減少磁盤(pán)I/O時(shí)間,從而提高響應(yīng)速度.
3.配置高速磁盤(pán)或合理分布磁盤(pán):高速磁盤(pán)提高I/O,分布磁盤(pán)能提高并行操作的能力.
2.2.2 優(yōu)化數(shù)據(jù)庫(kù)參數(shù)
優(yōu)化數(shù)據(jù)庫(kù)參數(shù)可以提高資源利用率,從而提高M(jìn)ySQL服務(wù)器性能.MySQL服務(wù)的配置參數(shù)都在my.cnf或my.ini,下面列出性能影響較大的幾個(gè)參數(shù).
2.2.3 分庫(kù)分表
因?yàn)閿?shù)據(jù)庫(kù)壓力過(guò)大,首先一個(gè)問(wèn)題就是高峰期系統(tǒng)性能可能會(huì)降低,因?yàn)閿?shù)據(jù)庫(kù)負(fù)載過(guò)高對(duì)性能會(huì)有影響。另外一個(gè),壓力過(guò)大把你的數(shù)據(jù)庫(kù)給搞掛了怎么辦?所以此時(shí)你必須得對(duì)系統(tǒng)做分庫(kù)分表 + 讀寫(xiě)分離,也就是把一個(gè)庫(kù)拆分為多個(gè)庫(kù),部署在多個(gè)數(shù)據(jù)庫(kù)服務(wù)上,這時(shí)作為主庫(kù)承載寫(xiě)入請(qǐng)求。然后每個(gè)主庫(kù)都掛載至少一個(gè)從庫(kù),由從庫(kù)來(lái)承載讀請(qǐng)求。
2.2.4 緩存集群
如果用戶(hù)量越來(lái)越大,此時(shí)你可以不停的加機(jī)器,比如說(shuō)系統(tǒng)層面不停加機(jī)器,就可以承載更高的并發(fā)請(qǐng)求。然后數(shù)據(jù)庫(kù)層面如果寫(xiě)入并發(fā)越來(lái)越高,就擴(kuò)容加數(shù)據(jù)庫(kù)服務(wù)器,通過(guò)分庫(kù)分表是可以支持?jǐn)U容機(jī)器的,如果數(shù)據(jù)庫(kù)層面的讀并發(fā)越來(lái)越高,就擴(kuò)容加更多的從庫(kù)。但是這里有一個(gè)很大的問(wèn)題:數(shù)據(jù)庫(kù)其實(shí)本身不是用來(lái)承載高并發(fā)請(qǐng)求的,所以通常來(lái)說(shuō),數(shù)據(jù)庫(kù)單機(jī)每秒承載的并發(fā)就在幾千的數(shù)量級(jí),而且數(shù)據(jù)庫(kù)使用的機(jī)器都是比較高配置,比較昂貴的機(jī)器,成本很高。如果你就是簡(jiǎn)單的不停的加機(jī)器,其實(shí)是不對(duì)的。所以在高并發(fā)架構(gòu)里通常都有緩存這個(gè)環(huán)節(jié),緩存系統(tǒng)的設(shè)計(jì)就是為了承載高并發(fā)而生。所以單機(jī)承載的并發(fā)量都在每秒幾萬(wàn),甚至每秒數(shù)十萬(wàn),對(duì)高并發(fā)的承載能力比數(shù)據(jù)庫(kù)系統(tǒng)要高出一到兩個(gè)數(shù)量級(jí)。所以你完全可以根據(jù)系統(tǒng)的業(yè)務(wù)特性,對(duì)那種寫(xiě)少讀多的請(qǐng)求,引入緩存集群。具體來(lái)說(shuō),就是在寫(xiě)數(shù)據(jù)庫(kù)的時(shí)候同時(shí)寫(xiě)一份數(shù)據(jù)到緩存集群里,然后用緩存集群來(lái)承載大部分的讀請(qǐng)求。這樣的話(huà),通過(guò)緩存集群,就可以用更少的機(jī)器資源承載更高的并發(fā)。
一個(gè)完整而復(fù)雜的高并發(fā)系統(tǒng)架構(gòu)中,一定會(huì)包含:各種復(fù)雜的自研基礎(chǔ)架構(gòu)系統(tǒng)。各種精妙的架構(gòu)設(shè)計(jì).因此一篇小文頂多具有拋磚引玉的效果,但是數(shù)據(jù)庫(kù)優(yōu)化的思想差不多就這些了.
選取最適用的字段屬性
MySQL可以很好的支持大數(shù)據(jù)量的存取,但是一般說(shuō)來(lái),數(shù)據(jù)庫(kù)中的表越小,在它上面執(zhí)行的查詢(xún)也就會(huì)越快。因此,在創(chuàng)建表的時(shí)候,為了獲得更好的性能,我們可以將表中字段的寬度設(shè)得盡可能小。
例如,在定義郵政編碼這個(gè)字段時(shí),如果將其設(shè)置為CHAR(255),顯然給數(shù)據(jù)庫(kù)增加了不必要的空間,甚至使用VARCHAR這種類(lèi)型也是多余的,因?yàn)镃HAR(6)就可以很好的完成任務(wù)了。同樣的,如果可以的話(huà),我們應(yīng)該使用MEDIUMINT而不是BIGIN來(lái)定義整型字段。
另外一個(gè)提高效率的方法是在可能的情況下,應(yīng)該盡量把字段設(shè)置為NOTNULL,這樣在將來(lái)執(zhí)行查詢(xún)的時(shí)候,數(shù)據(jù)庫(kù)不用去比較NULL值。 對(duì)于某些文本字段,例如“省份”或者“性別”,我們可以將它們定義為ENUM類(lèi)型。因?yàn)樵贛ySQL中,ENUM類(lèi)型被當(dāng)作數(shù)值型數(shù)據(jù)來(lái)處理,而數(shù)值型數(shù)據(jù)被處理起來(lái)的速度要比文本類(lèi)型快得多。這樣,我們又可以提高數(shù)據(jù)庫(kù)的性能。
1、explain:解釋sql的執(zhí)行計(jì)劃,后邊的sql不執(zhí)行
2、explain partitions :用于查看存在分區(qū)的表的執(zhí)行計(jì)劃
3、explain extended:待驗(yàn)證
4、show warnings:
5、show create table:查看表的詳細(xì)的創(chuàng)建語(yǔ)句,便于用戶(hù)對(duì)表進(jìn)行優(yōu)化
6、show indexes :產(chǎn)看表的所有索引,show indexes from table_name,同樣也可以從information_schema.statistics表中獲得同樣的信息。cardinality列很重要,表示數(shù)據(jù)量。
7、show tables status: 查看數(shù)據(jù)庫(kù)表的底層大小以及表結(jié)構(gòu),同樣可以從information_schema.tables表中獲得底層表的信息。
8、show [global|session]status:可以查看mysql服務(wù)器當(dāng)前內(nèi)部狀態(tài)信息??梢詭椭鷧s行mysql服務(wù)器的負(fù)載的各種指標(biāo)。默認(rèn)是session。同information_schema.global_status和information_schema.session_status
9、show [global|session] variables :查看當(dāng)前mysql系統(tǒng)變量的值,其中一些值能影響到sql語(yǔ)句的執(zhí)行方式。同information_schema.global_variables和information_schema.session_variables;
10、information_schema:包含的表的數(shù)量和mysql的版本有關(guān)系。
對(duì)結(jié)果進(jìn)行排序操作的代價(jià)可能很高,因此可以通過(guò)避免排序或讓參與排序的數(shù)據(jù)行更少來(lái)優(yōu)化查詢(xún)性能。
當(dāng) MySQL 不能使用索引產(chǎn)生有序結(jié)果時(shí),它必須對(duì)數(shù)據(jù)行進(jìn)行排序。這有可能是在內(nèi)存中進(jìn)行也可能是在磁盤(pán)進(jìn)行,但 MySQL 始終將這個(gè)過(guò)程稱(chēng)之為 filesort,即便實(shí)際上并沒(méi)有使用一個(gè)文件。
如果用于排序的值可以一次性放入排序緩存中,MySQL 可以在內(nèi)存中使用快排算法進(jìn)行排序。如果 MySQL 不能在內(nèi)存中進(jìn)行排序,則會(huì)在磁盤(pán)中按塊逐塊排序。它對(duì)每個(gè)塊使用快排算法,然后在將這些排序好的塊合并到結(jié)果中。
有兩個(gè)文件排序(filesort)算法:
很難說(shuō)哪種算法更有效,對(duì)每個(gè)算法來(lái)說(shuō)都會(huì)有最優(yōu)和最壞案例。MySQL 在數(shù)據(jù)表全部列加上用于排序的列的大小不超過(guò) max_length_for_sort_data 時(shí)會(huì)使用單次遍歷算法??梢酝ㄟ^(guò)修改這個(gè)參數(shù)影響排序算法的選擇。
需要注意的是,MySQL 的 filesort使用的臨時(shí)存儲(chǔ)空間可能會(huì)超出你的預(yù)期,這是因?yàn)樗鼘?duì)每個(gè)排序元素都分配了固定大小的存儲(chǔ)空間。這些存儲(chǔ)空間要足夠大以便容下存儲(chǔ)最大的元素,而且 VARCHAR這類(lèi)字段使用的是對(duì)應(yīng)的最大長(zhǎng)度。而且,如果使用的是 UTF-8字符集,MuSQL 會(huì)對(duì)每個(gè)字符分配3個(gè)字節(jié)。結(jié)果是,我們會(huì)發(fā)現(xiàn)那些沒(méi)怎么優(yōu)化的查詢(xún)會(huì)導(dǎo)致磁盤(pán)上的臨時(shí)存儲(chǔ)空間是數(shù)據(jù)表自身存儲(chǔ)空間的好幾倍。
而在對(duì)聯(lián)合查詢(xún)進(jìn)行排序時(shí),MySQL 可能會(huì)在查詢(xún)執(zhí)行過(guò)程中執(zhí)行兩次文件排序。如果 ORDER BY 子句只是引用聯(lián)合查詢(xún)的第一張表,MySQL 可以先對(duì)這個(gè)表進(jìn)行文件排序,然后再處理聯(lián)合查詢(xún)。如果是這種情況,在 EXPLAIN 時(shí)會(huì)在 Extra 字段顯示“Using filesort”。而對(duì)于其他的排序情況——例如排序不是針對(duì)第一張表,或者是 ORDER BY 使用的列對(duì)應(yīng)了不止一個(gè)數(shù)據(jù)表,MySQL 必須使用臨時(shí)表緩存查詢(xún)結(jié)果,然而在聯(lián)合查詢(xún)完成后,再對(duì)臨時(shí)表進(jìn)行文件排序。在這種情況下,EXPLAIN 會(huì)在 Extra 字段顯示“Using temorary; Using filesort”。如果包含 LIMIT 約束的話(huà),會(huì)發(fā)生在文件排序后,因此臨時(shí)表和文件排序的存儲(chǔ)空間可能非常大。
MySQL 5.6在只需要對(duì)數(shù)據(jù)行的子集(例如 LIMIT)進(jìn)行排序時(shí),引入了一個(gè)重大改進(jìn)。相對(duì)于對(duì)整個(gè)結(jié)果集進(jìn)行排序再返回部分?jǐn)?shù)據(jù),MySQL 有時(shí)候會(huì)在排序的時(shí)候直接丟棄掉不需要的數(shù)據(jù)行來(lái)提高效率。不管怎么樣,排序也需要小心使用,很可能會(huì)導(dǎo)致存儲(chǔ)占用的飆升最終導(dǎo)致系統(tǒng)負(fù)荷過(guò)大。
mysql的優(yōu)化大的有兩方面:
1、配置優(yōu)化
配置的優(yōu)化其實(shí)包含兩個(gè)方面的:操作系統(tǒng)內(nèi)核的優(yōu)化和mysql配置文件的優(yōu)化
1)系統(tǒng)內(nèi)核的優(yōu)化對(duì)專(zhuān)用的mysql服務(wù)器來(lái)說(shuō),無(wú)非是內(nèi)存實(shí)用、連接數(shù)、超時(shí)處理、TCP處理等方面的優(yōu)化,根據(jù)自己的硬件配置來(lái)進(jìn)行優(yōu)化,這里不多講;
2)mysql配置的優(yōu)化,一般來(lái)說(shuō)包含:IO處理的常用參數(shù)、最大連接數(shù)設(shè)置、緩存使用參數(shù)的設(shè)置、慢日志的參數(shù)的設(shè)置、innodb相關(guān)參數(shù)的設(shè)置等,如果有主從關(guān)系在設(shè)置主從同步的相關(guān)參數(shù)即可,網(wǎng)上的相關(guān)配置文件很多,大同小異,常用的設(shè)置大多修改這些差不多就夠用了。
2、sql語(yǔ)句的優(yōu)化
1) ?盡量稍作計(jì)算
Mysql的作用是用來(lái)存取數(shù)據(jù)的,不是做計(jì)算的,做計(jì)算的話(huà)可以用其他方法去實(shí)現(xiàn),mysql做計(jì)算是很耗資源的。
2)盡量少 join
MySQL 的優(yōu)勢(shì)在于簡(jiǎn)單,但這在某些方面其實(shí)也是其劣勢(shì)。MySQL 優(yōu)化器效率高,但是由于其統(tǒng)計(jì)信息的量有限,優(yōu)化器工作過(guò)程出現(xiàn)偏差的可能性也就更多。對(duì)于復(fù)雜的多表 Join,一方面由于其優(yōu)化器受限,再者在 Join 這方面所下的功夫還不夠,所以性能表現(xiàn)離 Oracle 等關(guān)系型數(shù)據(jù)庫(kù)前輩還是有一定距離。但如果是簡(jiǎn)單的單表查詢(xún),這一差距就會(huì)極小甚至在有些場(chǎng)景下要優(yōu)于這些數(shù)據(jù)庫(kù)前輩
3)盡量少排序
排序操作會(huì)消耗較多的 CPU 資源,所以減少排序可以在緩存命中率高等 IO 能力足夠的場(chǎng)景下會(huì)較大影響 SQL的響應(yīng)時(shí)間。
對(duì)于MySQL來(lái)說(shuō),減少排序有多種辦法,比如:
通過(guò)利用索引來(lái)排序的方式進(jìn)行優(yōu)化
減少參與排序的記錄條數(shù)
非必要不對(duì)數(shù)據(jù)進(jìn)行排序
4)盡量避免 select *
在數(shù)據(jù)量少并且訪問(wèn)量不大的情況下,select * 沒(méi)有什么影響,但是量級(jí)達(dá)到一定級(jí)別的時(shí)候,在執(zhí)行效率和IO資源的使用上,還是有很大關(guān)系的,用什么字段取什么字段,減少不必要的資源浪費(fèi)。
5)盡量用 join 代替子查詢(xún)
雖然 Join 性能并不佳,但是和 MySQL 的子查詢(xún)比起來(lái)還是有非常大的性能優(yōu)勢(shì)。MySQL 的子查詢(xún)執(zhí)行計(jì)劃一直存在較大的問(wèn)題,雖然這個(gè)問(wèn)題已經(jīng)存在多年,但是到目前已經(jīng)發(fā)布的所有穩(wěn)定版本中都普遍存在,一直沒(méi)有太大改善。雖然官方也在很早就承認(rèn)這一問(wèn)題,并且承諾盡快解決,但是至少到目前為止我們還沒(méi)有看到哪一個(gè)版本較好的解決了這一問(wèn)題。
1.存儲(chǔ)引擎的選擇如果數(shù)據(jù)表需要事務(wù)處理,應(yīng)該考慮使用InnoDB,因?yàn)樗耆螦CID特性。如果不需要事務(wù)處理,使用默認(rèn)存儲(chǔ)引擎MyISAM是比較明智的。并且不要嘗試同時(shí)使用這兩個(gè)存儲(chǔ)引擎。思考一下:在一個(gè)事務(wù)處理中,一些數(shù)據(jù)表使用InnoDB,而其余的使用MyISAM.結(jié)果呢?整個(gè)subject將被取消,只有那些在事務(wù)處理中的被帶回到原始狀態(tài),其余的被提交的數(shù)據(jù)轉(zhuǎn)存,這將導(dǎo)致整個(gè)數(shù)據(jù)庫(kù)的沖突。然而存在一個(gè)簡(jiǎn)單的方法可以同時(shí)利用兩個(gè)存儲(chǔ)引擎的優(yōu)勢(shì)。目前大多數(shù)MySQL套件中包括InnoDB、編譯器和鏈表,但如果你選擇MyISAM,你仍然可以單獨(dú)下載InnoDB,并把它作為一個(gè)插件。很簡(jiǎn)單的方法,不是嗎?
2.計(jì)數(shù)問(wèn)題如果數(shù)據(jù)表采用的存儲(chǔ)引擎支持事務(wù)處理(如InnoDB),你就不應(yīng)使用COUNT(*)計(jì)算數(shù)據(jù)表中的行數(shù)。這是因?yàn)樵诋a(chǎn)品類(lèi)數(shù)據(jù)庫(kù)使用COUNT(*),最多返回一個(gè)近似值,因?yàn)樵谀硞€(gè)特定時(shí)間,總有一些事務(wù)處理正在運(yùn)行。如果使用COUNT(*)顯然會(huì)產(chǎn)生bug,出現(xiàn)這種錯(cuò)誤結(jié)果。
3.反復(fù)測(cè)試查詢(xún)查詢(xún)最棘手的問(wèn)題并不是無(wú)論怎樣小心總會(huì)出現(xiàn)錯(cuò)誤,并導(dǎo)致bug出現(xiàn)。恰恰相反,問(wèn)題是在大多數(shù)情況下bug出現(xiàn)時(shí),應(yīng)用程序或數(shù)據(jù)庫(kù)已經(jīng)上線。的確不存在針對(duì)該問(wèn)題切實(shí)可行的解決方法,除非將測(cè)試樣本在應(yīng)用程序或數(shù)據(jù)庫(kù)上運(yùn)行。任何數(shù)據(jù)庫(kù)查詢(xún)只有經(jīng)過(guò)上千個(gè)記錄的大量樣本測(cè)試,才能被認(rèn)可。
4.避免全表掃描通常情況下,如果MySQL(或者其他關(guān)系數(shù)據(jù)庫(kù)模型)需要在數(shù)據(jù)表中搜索或掃描任意特定記錄時(shí),就會(huì)用到全表掃描。此外,通常最簡(jiǎn)單的方法是使用索引表,以解決全表掃描引起的低效能問(wèn)題。然而,正如我們?cè)陔S后的問(wèn)題中看到的,這存在錯(cuò)誤部分。
5.使用“EXPLAIN”進(jìn)行查詢(xún)當(dāng)需要調(diào)試時(shí),EXPLAIN是一個(gè)很好的命令,下面將對(duì)EXPLAIN進(jìn)行深入探討。