MySQL的索引原理是什么

本篇內(nèi)容介紹了“MySQL的索引原理是什么”的有關(guān)知識(shí)，在實(shí)際案例的操作過(guò)程中，不少人都會(huì)遇到這樣的困境，接下來(lái)就讓小編帶領(lǐng)大家學(xué)習(xí)一下如何處理這些情況吧！希望大家仔細(xì)閱讀，能夠?qū)W有所成！

創(chuàng)新互聯(lián)是一家專(zhuān)注于成都網(wǎng)站設(shè)計(jì)、網(wǎng)站制作、外貿(mào)營(yíng)銷(xiāo)網(wǎng)站建設(shè)與策劃設(shè)計(jì),曲阜網(wǎng)站建設(shè)哪家好?創(chuàng)新互聯(lián)做網(wǎng)站,專(zhuān)注于網(wǎng)站建設(shè)10年,網(wǎng)設(shè)計(jì)領(lǐng)域的專(zhuān)業(yè)建站公司;建站業(yè)務(wù)涵蓋:曲阜等地區(qū)。曲阜做網(wǎng)站價(jià)格咨詢:13518219792

1、索引的本質(zhì)

索引的本質(zhì)是一種排好序的數(shù)據(jù)結(jié)構(gòu)。這個(gè)我相信其實(shí)大家并不陌生，因?yàn)檎劦剿饕芏嗳俗匀欢坏木蜁?huì)聯(lián)想到字典中的目錄。

沒(méi)錯(cuò)，這樣的類(lèi)比是很形象的，但是如果再往深處說(shuō)，恐怕很多小伙伴就有點(diǎn)張口結(jié)舌了，那既然你已經(jīng)知道了索引的本質(zhì)，那么您就已經(jīng)有了看這篇文章的基礎(chǔ)，相信讀文本文的你，一定會(huì)對(duì)索引的原理有一個(gè)全新的了解。

2、索引的分類(lèi)

在數(shù)據(jù)庫(kù)中，索引是分很多種類(lèi)的(千萬(wàn)不要狹隘的認(rèn)為索引只有 B+ 樹(shù)，那是因?yàn)槲覀兤綍r(shí)使用的基本都是 MySQL)。而不同的種類(lèi)很顯然是為了應(yīng)付不同的場(chǎng)合，那索引到底有那些種類(lèi)呢?下面就讓我們來(lái)大致的了解下。

2.1、Hash 索引

Hash 索引是比較常見(jiàn)的一種索引，他的單條記錄查詢的效率很高，時(shí)間復(fù)雜度為1。但是，Hash索引并不是最常用的數(shù)據(jù)庫(kù)索引類(lèi)型，尤其是我們常用的Mysql Innodb引擎就是不支持hash索引的。主要有以下原因：

Hash索引適合精確查找，但是范圍查找不適合

* 因?yàn)榇鎯?chǔ)引擎都會(huì)為每一行計(jì)算一個(gè)hash碼，hash碼都是比較小的，并且不同鍵值行的hash碼通常是不一樣的，hash索引中存儲(chǔ)的就是Hash碼，hash 碼彼此之間是沒(méi)有規(guī)律的，且 Hash 操作并不能保證順序性，所以值相近的兩個(gè)數(shù)據(jù)，Hash值相差很遠(yuǎn)，被分到不同的桶中。這就是為什么hash索引只能進(jìn)行全職匹配的查詢，因?yàn)橹挥羞@樣，hash碼才能夠匹配到數(shù)據(jù)。

對(duì)于 hash 索引，小伙伴們只需要了解到這里就可以了。

2.2、二叉樹(shù)

另外，常見(jiàn)的索引使用的數(shù)據(jù)結(jié)構(gòu)是樹(shù)結(jié)構(gòu)，首先我們來(lái)介紹下最經(jīng)典的二叉樹(shù)。先來(lái)介紹下二叉樹(shù)的特點(diǎn)：

二叉樹(shù)的時(shí)間復(fù)雜度為 O(n)
一個(gè)節(jié)點(diǎn)只能有兩個(gè)子節(jié)點(diǎn)。即度不超過(guò)2
左子節(jié)點(diǎn) 小于本節(jié)點(diǎn)，右子節(jié)點(diǎn) 大于本節(jié)點(diǎn)

首先來(lái)看一下二叉樹(shù)的樣子

MySQL的索引原理是什么

但是在極端情況下會(huì)出現(xiàn)鏈化的情況，即節(jié)點(diǎn)一直在某一邊增加。如下圖

MySQL的索引原理是什么

二叉樹(shù)中，有一種特殊的結(jié)構(gòu)——平衡二叉樹(shù)，平衡二叉樹(shù)的特點(diǎn)：

根節(jié)點(diǎn)會(huì)隨著數(shù)據(jù)的改變而變更
數(shù)據(jù)量越多，遍歷次數(shù)越多，IO次數(shù)就越多，就越慢(磁盤(pán)的IO由樹(shù)高決定)

2.4、B樹(shù)(二三樹(shù))

了解了二叉樹(shù)之后，可以進(jìn)一步談一下什么是B樹(shù)了。B 樹(shù)大概是這樣子的：

MySQL的索引原理是什么

從B樹(shù)的結(jié)構(gòu)圖中可以看到每個(gè)節(jié)點(diǎn)中不僅包含數(shù)據(jù)的 key 值，還有 data 值。而每頁(yè)的存儲(chǔ)空間是有限的，如果 data 比較大，會(huì)導(dǎo)致每個(gè)節(jié)點(diǎn)的 key 存儲(chǔ)的較少，當(dāng)數(shù)據(jù)量較大的時(shí)候，同樣會(huì)導(dǎo)致B樹(shù)很深，從而增加了磁盤(pán) IO 的次數(shù)，進(jìn)而影響查詢效率。好了，說(shuō)到這里，常見(jiàn)的索引的種類(lèi)也說(shuō)完了，上面的內(nèi)容僅僅是作為一個(gè)鋪墊，下面我們正式開(kāi)始 MySQL 的 B+ 樹(shù)。

2.5、B+樹(shù)

MySQL 中最常用的索引的數(shù)據(jù)結(jié)構(gòu)是 B+ 樹(shù)，他有以下特點(diǎn)：

鴻蒙官方戰(zhàn)略合作共建——HarmonyOS技術(shù)社區(qū)
在 B+ 樹(shù)中，所有數(shù)據(jù)記錄節(jié)點(diǎn)都是按照鍵值的大小存放在同一層的葉子節(jié)點(diǎn)上，而非葉子結(jié)點(diǎn)只存儲(chǔ)key的信息，這樣可以大大減少每個(gè)節(jié)點(diǎn)的存儲(chǔ)的key的數(shù)量，降低B+ 樹(shù)的高度
B+ 樹(shù)葉子節(jié)點(diǎn)的關(guān)鍵字從小到大有序排列，左邊結(jié)尾數(shù)據(jù)都會(huì)保存右邊節(jié)點(diǎn)開(kāi)始數(shù)據(jù)的指針。
B+ 樹(shù)的層級(jí)更少：相較于 B 樹(shù) B+ 每個(gè)非葉子節(jié)點(diǎn)存儲(chǔ)的關(guān)鍵字?jǐn)?shù)更多，樹(shù)的層級(jí)更少所以查詢數(shù)據(jù)更快
B+ 樹(shù)查詢速度更穩(wěn)定：B+ 所有關(guān)鍵字?jǐn)?shù)據(jù)地址都存在葉子節(jié)點(diǎn)上，所以每次查找的次數(shù)都相同所以查詢速度要比B樹(shù)更穩(wěn)定;
B+ 樹(shù)天然具備排序功能：B+ 樹(shù)所有的葉子節(jié)點(diǎn)數(shù)據(jù)構(gòu)成了一個(gè)有序鏈表，在查詢大小區(qū)間的數(shù)據(jù)時(shí)候更方便，數(shù)據(jù)緊密性很高，緩存的命中率也會(huì)比B樹(shù)高。
B+ 樹(shù)全節(jié)點(diǎn)遍歷更快：B+ 樹(shù)遍歷整棵樹(shù)只需要遍歷所有的葉子節(jié)點(diǎn)即可，，而不需要像 B 樹(shù)一樣需要對(duì)每一層進(jìn)行遍歷，這有利于數(shù)據(jù)庫(kù)做全表掃描。

好了說(shuō)了這么多的 B+ 樹(shù)的特點(diǎn)，我們來(lái)張圖看看 B+ 樹(shù)到底長(zhǎng)什么樣子(如果看不懂，也沒(méi)有關(guān)系，下文會(huì)一步一步解釋說(shuō)明的)

MySQL的索引原理是什么

上面的數(shù)據(jù)頁(yè)就是實(shí)際存放數(shù)據(jù)頁(yè)的地方，且數(shù)據(jù)頁(yè)之間是通過(guò)雙向鏈表進(jìn)行連接的，好了到這里我們就將各個(gè)索引的類(lèi)型快速了解了下，下面我們就開(kāi)始正式B+樹(shù)的分析。

3、主鍵目錄

我們將上圖中的數(shù)據(jù)頁(yè)拿出來(lái)再細(xì)化下，就成了下面的這張圖

MySQL的索引原理是什么

我們都知道 MySQL 在存儲(chǔ)數(shù)據(jù)的時(shí)候是以數(shù)據(jù)頁(yè)為最小單位的，且數(shù)據(jù)在數(shù)據(jù)頁(yè)中的存儲(chǔ)是連續(xù)的，數(shù)據(jù)頁(yè)中的數(shù)據(jù)是按照主鍵排序的(沒(méi)有主鍵是由 MySQL自己維護(hù)的 ROW_ID 來(lái)排序的)，數(shù)據(jù)頁(yè)和數(shù)據(jù)頁(yè)之間是通過(guò)雙向鏈表來(lái)關(guān)聯(lián)的，數(shù)據(jù)與數(shù)據(jù)時(shí)間是通過(guò)單向鏈表來(lái)關(guān)聯(lián)的。

也就是說(shuō)有一個(gè)在每個(gè)數(shù)據(jù)頁(yè)中，他必然就有一個(gè)最小的主鍵，然后每個(gè)數(shù)據(jù)頁(yè)的頁(yè)號(hào)和最小的主鍵會(huì)組成一個(gè)主鍵目錄(就像上圖中的左邊部分)，假設(shè)現(xiàn)在要查找主鍵為 2 的數(shù)據(jù)，通過(guò)二分查找法最后確定下主鍵為 2 的記錄在數(shù)據(jù)頁(yè) 1 中，此時(shí)就會(huì)定位到數(shù)據(jù)頁(yè) 1 接著再去定位主鍵為 2 的記錄，我們先知道大致的流程，細(xì)節(jié)先不要深究，先從宏觀看結(jié)構(gòu)原理，再到微觀看實(shí)現(xiàn)原理。

剛剛上面是說(shuō)的其實(shí)可以理解為是主鍵索引，主鍵索引也是最簡(jiǎn)單的最基礎(chǔ)的索引。這個(gè)時(shí)候大家應(yīng)該知道為什么你建立了主鍵查詢就能變快了吧?

4、索引頁(yè)

但是現(xiàn)在假設(shè)有很多很多的是數(shù)據(jù)頁(yè)，那是不是對(duì)應(yīng)的主鍵目錄會(huì)很大很大呢?那假設(shè)有1000萬(wàn)條記錄、5000萬(wàn)條記錄呢?是不是就算是二分法查找，其效率也依舊是很低的，所以為了解決這種問(wèn)題MySQL 又設(shè)計(jì)出了一種新的存儲(chǔ)結(jié)構(gòu)—索引頁(yè)。例如有下面這樣情況，

MySQL的索引原理是什么

假設(shè)上面的主鍵目錄中的記錄是非常非常多的，此時(shí)上面的結(jié)構(gòu)是演變成這樣子的，MySQL 會(huì)將里面的記錄拆分到不同的索引頁(yè)中，也就是下面這樣子的

MySQL的索引原理是什么

索引頁(yè)中記錄的是每頁(yè)數(shù)據(jù)頁(yè)的頁(yè)號(hào)和該數(shù)據(jù)頁(yè)中最小的主鍵的記錄，也就是說(shuō)最小主鍵和數(shù)據(jù)頁(yè)號(hào)不是單純的維護(hù)在主鍵目錄中了，而是演變成了索引頁(yè)，索引頁(yè)和數(shù)據(jù)頁(yè)類(lèi)似，一張不夠存就分裂到下一張。

假如現(xiàn)在要查找 id=20 的這條記錄，咦?那我應(yīng)該到哪個(gè)索引頁(yè)中查找該條記錄呢?所以這個(gè)時(shí)候肯定是需要去維護(hù)索引頁(yè)的。

沒(méi)錯(cuò)，MySQL 也是這么設(shè)計(jì)的，也就是說(shuō) MySQL 同時(shí)也設(shè)計(jì)出了用于維護(hù)索引頁(yè)的數(shù)據(jù)結(jié)構(gòu)，其實(shí)也還叫索引頁(yè)，只不過(guò)他們是在不同的層級(jí)，類(lèi)似下面這樣子的：

MySQL的索引原理是什么

也就是說(shuō)維護(hù)索引頁(yè)的索引頁(yè)是在真正存儲(chǔ)記錄和數(shù)據(jù)頁(yè)的索引頁(yè)的上一層，現(xiàn)在如果你想查找 id=20 的這條記錄，那就是從最上層的索引頁(yè)開(kāi)始查找，通過(guò)二分法查找，很快就能夠定位到 id=20 s這條記錄是在索引頁(yè) 2 上，然后到就索引頁(yè) 2 上面查找，接著就是和之前一樣了(注意，索引頁(yè)中的記錄也是通過(guò)單向鏈表連接的)，根據(jù)各個(gè)最小的主鍵能夠定位到 id=20 是在數(shù)據(jù)頁(yè)5上，假設(shè)數(shù)據(jù)頁(yè)5是這樣子的

MySQL的索引原理是什么

那這個(gè)時(shí)候你是不是能夠想明白數(shù)據(jù)是怎么定位的了呢?

5、索引頁(yè)的分層

好，既然你已經(jīng)知道到索引頁(yè)太多會(huì)往上一層擴(kuò)散，那現(xiàn)在假設(shè)上一層的索引頁(yè)記錄也太多了，那該怎么辦?很簡(jiǎn)單，繼續(xù)分裂，再往上一層繼續(xù)，不廢話，我來(lái)畫(huà)圖幫助大家理解

MySQL的索引原理是什么

我看明白了，你看明白了嗎?我們來(lái)模擬一個(gè)查找的過(guò)程，假設(shè)你要查找 37 這條記錄，說(shuō)實(shí)話我根本不知道這條記錄在哪里。好，現(xiàn)在我們就來(lái)模擬 MySQL 的查找過(guò)程，首先從最頂層的索引頁(yè)開(kāi)始查找，因?yàn)?id=37，因此定位到了索引頁(yè)16，然后到索引頁(yè) 16 中繼續(xù)查找，此時(shí)同樣能夠定位到 id=37 在索引頁(yè) 3 中，然后繼續(xù)查找，最終能夠定位到數(shù)據(jù)實(shí)在數(shù)據(jù)頁(yè) 8 中，假設(shè)數(shù)據(jù)頁(yè) 8 是這樣子的

MySQL的索引原理是什么

是不是很完美?如果非要我把上面的圖畫(huà)完整，那….小弟義不容辭(圖太大了，索引頁(yè)中數(shù)據(jù)的鏈表結(jié)構(gòu)就不畫(huà)出來(lái)了)

MySQL的索引原理是什么

這個(gè)時(shí)候機(jī)智的你是不是已經(jīng)發(fā)現(xiàn)了什么小秘密?他是不是很像一顆二叉樹(shù)?實(shí)際上這就是一顆 B+ 樹(shù)的結(jié)構(gòu)，這也是數(shù)據(jù)在磁盤(pán)中真正存儲(chǔ)的物理結(jié)構(gòu)。B+樹(shù)的特性是什么呢?B+樹(shù)，也是二叉搜索樹(shù)的一種，但是他的數(shù)據(jù)僅僅存儲(chǔ)在葉子節(jié)點(diǎn)(在這里就是數(shù)據(jù)頁(yè))，像這種索引頁(yè)+數(shù)據(jù)頁(yè)組成的組成的B+樹(shù)就是聚簇索引(這句話很重要)。

聚簇索引是 MySQL 基于主鍵索引結(jié)構(gòu)創(chuàng)建的

6、非主鍵索引

但是現(xiàn)在問(wèn)題又來(lái)了，既然這里強(qiáng)調(diào)的是主鍵索引，那我們平時(shí)開(kāi)發(fā)中除了主鍵索引其他的索引也用的不少，這時(shí)候該怎么辦?假設(shè)你現(xiàn)在對(duì)name、age建立索引?，F(xiàn)在回顧下主鍵索引，是不是在插入數(shù)據(jù)的時(shí)候基于主鍵的順序去維護(hù)一個(gè) B+ 樹(shù)的?

而實(shí)際上非主鍵索引其原理是一樣的，MySQL 都是去維護(hù)一顆 B+ 樹(shù)，說(shuō)白了，你建立多少個(gè)索引，MySQL 就會(huì)幫你維護(hù)多少的B+樹(shù)(這下是不是也突然想明白了為什么索引不能建立太多了?以前就知道不能建立太多索引，因?yàn)樗饕矔?huì)占用空間，實(shí)際上這就是根本原因)

假如現(xiàn)在真的對(duì) name+age 建立索引，那此時(shí)是存放的呢?此時(shí) MySQL 根據(jù)會(huì) name+age 維護(hù)一個(gè)單獨(dú)的 B+ 樹(shù)結(jié)構(gòu)，數(shù)據(jù)依舊是存放在數(shù)據(jù)頁(yè)中的，只不過(guò)是原來(lái)數(shù)據(jù)中的每條記錄寫(xiě)的是 id=xx，現(xiàn)在寫(xiě)的是name=xx，age=xx，id=xx，不管怎么樣，主鍵肯定會(huì)存放的，先來(lái)張圖壓壓驚

MySQL的索引原理是什么

在插入數(shù)據(jù)的時(shí)候，MySQL 首先會(huì)根據(jù) name 進(jìn)行排序，如果 name 一樣，就根據(jù)聯(lián)合索引中的 age 去排序，如果還一樣，那么就會(huì)根據(jù) 主鍵字段去排序。插入的原理就是這樣子的。

此時(shí)每個(gè)數(shù)據(jù)頁(yè)中的記錄存放的實(shí)際是索引字段和主鍵字段，而其他字段是不存的(為什么不存放?一樣的數(shù)據(jù)到處存放很浪費(fèi)空間的，也沒(méi)必要，所以才會(huì)有下面的索引優(yōu)化)，至于查找，原理和過(guò)程跟聚簇索引一樣，這里就不再贅述，但是，下面說(shuō)的內(nèi)容卻是至關(guān)重要的：假設(shè)現(xiàn)在執(zhí)行這樣的SQL：

SELECT name FROM student WHERE name='wx'

那么此時(shí)的查詢是完美的，使用到了索引且不需要回表

7.回表

是這樣子的，現(xiàn)在要根據(jù) name 查找到該條記錄，且查詢的字段(即 select 后面的查詢字段)也僅僅有 name(只要是在 name,age,id 這三個(gè)字段中都可以)這個(gè)時(shí)候是能夠直接獲取到最終的記錄的

換句話說(shuō)，因?yàn)槁?lián)合索引中的記錄也僅僅有 name，age，id，所以在查詢的如果也僅僅查詢這三個(gè)字段，那么在該B+樹(shù)中就能夠查詢到想要的結(jié)果了。那現(xiàn)在假設(shè)查詢的 SQL 是這樣子的(我們假設(shè) student 中還有除了name，age，id 其他的字段 )

SELECT * FROM student WHERE name='wx'

那這下子就完蛋了，因?yàn)槟悻F(xiàn)在雖然根據(jù) name 很快的定位到了該條記錄，但是因?yàn)?name+age 不是聚簇索引，此時(shí)的 B+ 樹(shù)的數(shù)據(jù)頁(yè)中存放的僅僅是自己關(guān)聯(lián)的索引和主鍵索引字段，并不會(huì)存其他的字段，所以這個(gè)時(shí)候其他的屬性值是獲取不到的，這時(shí)候該怎么辦?

這種情況下，MySQL 就需要進(jìn)行回表查詢了。此時(shí) MySQL 就會(huì)根據(jù)定位到的某條記錄中的 id 再次進(jìn)行聚簇索引查找，也就是說(shuō)會(huì)根據(jù) id 去維護(hù) id 的那么 B+ 樹(shù)中查找。因?yàn)榫鄞厮饕袛?shù)據(jù)頁(yè)記錄的是一條記錄的完整的記錄，這個(gè)過(guò)程就叫回表。

再?gòu)?qiáng)調(diào)下回表的含義：根據(jù)非主鍵索引查詢到的結(jié)果并沒(méi)有查找的字段值，此時(shí)就需要再次根據(jù)主鍵從聚簇索引的根節(jié)點(diǎn)開(kāi)始查找，這樣再次查找到的記錄才是完成的。

最后，讓我一起看下 MySQL 對(duì)于非主鍵索引的維護(hù)過(guò)程：

對(duì)于非主鍵索引(一般都是聯(lián)合索引)，在維護(hù) B+ 樹(shù)的時(shí)候，會(huì)根據(jù)聯(lián)合索引的字段依次去判斷，假設(shè)聯(lián)合索引為：name + address + age，那么 MySQL 在維護(hù)該索引的 B+ 樹(shù)的時(shí)候，首先會(huì)根據(jù) name 進(jìn)行排序，name 相同的話會(huì)根據(jù)第二個(gè) address 排序，如果 address 也一樣，那么就會(huì)根據(jù) age 去排序，如果 age 也一樣，那么就會(huì)根據(jù)主鍵字段值去排序，且對(duì)于非主鍵索引，MySQL 在維護(hù) B+ 樹(shù)的時(shí)候，僅僅是維護(hù)索引字段和主鍵字段。

“MySQL的索引原理是什么”的內(nèi)容就介紹到這里了，感謝大家的閱讀。如果想了解更多行業(yè)相關(guān)的知識(shí)可以關(guān)注創(chuàng)新互聯(lián)網(wǎng)站，小編將為大家輸出更多高質(zhì)量的實(shí)用文章！

網(wǎng)站名稱(chēng)：MySQL的索引原理是什么
網(wǎng)站URL：http://weahome.cn/article/jsiipe.html

真实的国产乱ⅩXXX66竹夫人,五月香六月婷婷激情综合,亚洲日本VA一区二区三区,亚洲精品一区二区三区麻豆

MySQL的索引原理是什么

1、索引的本質(zhì)

2、索引的分類(lèi)

3、主鍵目錄

4、索引頁(yè)

5、索引頁(yè)的分層

6、非主鍵索引

7.回表

其他資訊

網(wǎng)站制作

企業(yè)服務(wù)

網(wǎng)站建設(shè)

服務(wù)器托管

真实的国产乱ⅩXXX66竹夫人,五月香六月婷婷激情综合,亚洲日本VA一区二区三区,亚洲精品一区二区三区麻豆

MySQL的索引原理是什么

1、索引的本質(zhì)

2、索引的分類(lèi)

3、主鍵目錄

4、索引頁(yè)

5、索引頁(yè)的分層

6、非主鍵索引

7.回表

其他資訊

網(wǎng)站制作

企業(yè)服務(wù)

網(wǎng)站建設(shè)

服務(wù)器托管

1、索引的本質(zhì)

2、索引的分類(lèi)

3、主鍵目錄

4、索引頁(yè)

5、索引頁(yè)的分層

6、非主鍵索引