非聚集索引中的臨界點(diǎn)(TippingPoint)-創(chuàng)新互聯(lián)

什么是臨界點(diǎn)?

成都創(chuàng)新互聯(lián)公司主要從事網(wǎng)頁設(shè)計(jì)、PC網(wǎng)站建設(shè)（電腦版網(wǎng)站建設(shè)）、wap網(wǎng)站建設(shè)（手機(jī)版網(wǎng)站建設(shè)）、響應(yīng)式網(wǎng)站設(shè)計(jì)、程序開發(fā)、網(wǎng)站優(yōu)化、微網(wǎng)站、微信平臺(tái)小程序開發(fā)等，憑借多年來在互聯(lián)網(wǎng)的打拼，我們?cè)诨ヂ?lián)網(wǎng)網(wǎng)站建設(shè)行業(yè)積累了豐富的成都網(wǎng)站設(shè)計(jì)、做網(wǎng)站、網(wǎng)站設(shè)計(jì)、網(wǎng)絡(luò)營銷經(jīng)驗(yàn)，集策劃、開發(fā)、設(shè)計(jì)、營銷、管理等多方位專業(yè)化運(yùn)作于一體。

注意，我要說的問題是非聚集索引的執(zhí)行計(jì)劃從Seek+Lookup變成Table/Clustered Index Scan的臨界點(diǎn)。SQL Server的訪問數(shù)據(jù)的IO最小單元是頁。

我們知道聚集索引的葉級(jí)是數(shù)據(jù)頁，非聚集索引的葉級(jí)是指向數(shù)據(jù)行的指針。所以通過聚集索引獲取數(shù)據(jù)時(shí)，就是直接訪問聚集索引本身，而通過非聚集索引獲取數(shù)據(jù)時(shí)，除了訪問自身，還要通過指針去訪問數(shù)據(jù)頁。這個(gè)過程就是RID/Key Lookup。而此Lookup是一個(gè)單頁操作，即每次使用一個(gè)RID/Key，然后去訪問對(duì)應(yīng)的一個(gè)數(shù)據(jù)頁，然后獲取頁上的相應(yīng)的數(shù)據(jù)行。可能當(dāng)前數(shù)據(jù)頁的有多個(gè)數(shù)據(jù)行是符合查詢要求的，但是一次lookup，只能取當(dāng)前的RID/Key指定的數(shù)據(jù)行。所以同一個(gè)數(shù)據(jù)頁，可能要被訪問很多次。例如，現(xiàn)在lookup要去找RID為2，3，5，7，9對(duì)應(yīng)的數(shù)據(jù)行，而這5個(gè)數(shù)據(jù)行都存在數(shù)據(jù)頁N上，則數(shù)據(jù)頁N只少要被訪問5次。

在Seek時(shí)，如果要返回N行數(shù)據(jù)，則Seek操作至少要訪問N次數(shù)據(jù)頁。當(dāng)Lookup訪問次數(shù)據(jù)超過了全表數(shù)據(jù)頁的總數(shù)時(shí)，就會(huì)出現(xiàn)臨界點(diǎn)。這個(gè)時(shí)候Scan操作成本要比Lookup低。超過這個(gè)臨界點(diǎn)時(shí)，查詢優(yōu)化器一般會(huì)選擇Scan替代Seek+Lookup。例如表T有100000行，每頁存放100行，共有1000頁。查詢1000條數(shù)據(jù)，理論/理想情況下：Scan最少時(shí)只需要10次IO，Lookup只少需要1000次IO。

需要注意的是覆蓋索引中不存在RID/Key，而是對(duì)應(yīng)的列值，所以不會(huì)出現(xiàn)這個(gè)問題。

臨界點(diǎn)什么時(shí)候出現(xiàn)?

前面說的理論和原理上的東西，而實(shí)際臨界點(diǎn)的出現(xiàn)由很多因素決定。但主要與表的總頁數(shù)相關(guān)。臨界點(diǎn)大概出現(xiàn)在訪問頁占全表頁數(shù)的25%~33%時(shí)。為了直觀，通常把頁數(shù)再轉(zhuǎn)換成行數(shù)來分析。轉(zhuǎn)換時(shí)需要注意，前面闡明Lookup是單頁操作，所以頁數(shù)=行數(shù)。

一個(gè)表總行數(shù)為1,000,000，每頁存放2條行數(shù)，共500,000頁。則25%=125,000,33%=166,000。臨界點(diǎn)會(huì)出現(xiàn)在125,000頁和166,000頁間。轉(zhuǎn)換成行表示就是125000/(2*500000)=12.5%，166000/(2*500000)=16.6%。也就是說當(dāng)返回行數(shù)小于62400(500000*12.55)時(shí)，很可能會(huì)使用Lookup。當(dāng)返回行數(shù)大于83000時(shí)，很可能會(huì)使用Scan。這個(gè)表的行太寬了，一個(gè)頁只能存放2行數(shù)據(jù)，從百分比看起來沒有什么太大感覺。

一個(gè)表總行數(shù)為1,000,000，每頁存放100條行數(shù)，共10,000頁。則25%=2500，33%=3300。轉(zhuǎn)換成行2500/1000000=0.25%,3300/1000000=0.33%。它的臨界點(diǎn)上限不超過0.5%。也就是說你查詢表中不到0.5%的行數(shù)時(shí)，會(huì)全表掃描。

一個(gè)表總行數(shù)為1,000,000，每頁存放20條行數(shù)，共50,000頁。則25%=125,00,33%=166,00。轉(zhuǎn)換成行表示就是125000/(2*500000)=1.25%，166000/(2*500000)=1.66%。

不難發(fā)現(xiàn)，臨界點(diǎn)判斷，對(duì)于大表的查詢性能是有很大幫助的。而對(duì)于小表而言，幾乎都會(huì)是Scan，但是數(shù)據(jù)庫有緩存機(jī)制，小表會(huì)完整緩存，掃描影響也不大。

我們能做些什么？

1.很容易想到，既然表有Seek對(duì)應(yīng)的索引，我們使用Hint強(qiáng)制使用Seek，問題不就解決了。這個(gè)不一定，本來這個(gè)問題的出現(xiàn)就是查詢優(yōu)化器認(rèn)為Scan比Lookup的成本要低。如果你強(qiáng)制可能會(huì)適得其反。SQL Server的查詢優(yōu)化器是很強(qiáng)大和智能的，除非你嚴(yán)格測(cè)試過，證明ForceSeek性能更好一些。

2.建立一個(gè)覆蓋索引消除Lookup操作。

示例分析

使用AdventureWorks2012的Sales.SalesOrderDetail。在ProductID列有一個(gè)非聚集索引IX_SalesOrderDetail_ProductID。

通過下的查詢可以知道表有121317行，共1237個(gè)數(shù)據(jù)頁，每頁大約存放98行數(shù)據(jù)。由此我們可以預(yù)估一下臨界點(diǎn)在(309行，408行)附近。

select page_count,record_count from sys.dm_db_index_physical_stats(db_id(),object_id(N'Sales.SalesOrderDetail'),1,null,'detailed') where index_level=0

然后再統(tǒng)計(jì)一下不同的ProductID在表中行數(shù)，好針對(duì)性的測(cè)試不同ProductID:

select ProductID,COUNT(*) as cnt from Sales.SalesOrderDetail group by ProductID order by cnt

通過上面查詢，我們知道ProductID=882在表中有407行，可以看到它還是使用Lookup的方式。它的IO計(jì)數(shù)為：

Table 'SalesOrderDetail'. Scan count 1, logical reads 1258

非聚集索引中的臨界點(diǎn)(Tipping Point)

ProductID=751在表中有409行，它就使用了Scan的方式。它的IO計(jì)數(shù)為：

Table 'SalesOrderDetail'. Scan count 1, logical reads 1246

非聚集索引中的臨界點(diǎn)(Tipping Point)

我們還可以測(cè)試其它的返回行數(shù)更多的ProductID，如果是掃描的方式則IO都是在1246，如果是Lookup則都會(huì)高于1246。證明跟理論還是契合的。

就算500行返回才會(huì)超過臨界點(diǎn)，而500行也只占總行數(shù)的500/121317=0.41%。也就是說當(dāng)返回行數(shù)超過全表的0.41%時(shí)，優(yōu)化器就認(rèn)為它的篩選度不夠高了，不用seek+lookup，要掃描了。

總結(jié)

1. 當(dāng)遇到"明明有索引，為什么會(huì)掃描？"，臨界點(diǎn)的問題可能是原因之一。

2. 因?yàn)榇嬖谂R界點(diǎn)，所以非覆蓋非聚集索引的使用率可能沒有我們想象的高。

參考

http://www.sqlskills.com/blogs/kimberly/the-tipping-point-query-answers/

另外有需要云服務(wù)器可以了解下創(chuàng)新互聯(lián)cdcxhl.cn，海內(nèi)外云服務(wù)器15元起步，三天無理由+7*72小時(shí)售后在線，公司持有idc許可證，提供“云服務(wù)器、裸金屬服務(wù)器、高防服務(wù)器、香港服務(wù)器、美國服務(wù)器、虛擬主機(jī)、免備案服務(wù)器”等云主機(jī)租用服務(wù)以及企業(yè)上云的綜合解決方案，具有“安全穩(wěn)定、簡單易用、服務(wù)可用性高、性價(jià)比高”等特點(diǎn)與優(yōu)勢(shì)，專為企業(yè)上云打造定制，能夠滿足用戶豐富、多元化的應(yīng)用場(chǎng)景需求。

本文題目：非聚集索引中的臨界點(diǎn)(TippingPoint)-創(chuàng)新互聯(lián)
網(wǎng)站路徑：http://weahome.cn/article/djpijh.html

真实的国产乱ⅩXXX66竹夫人,五月香六月婷婷激情综合,亚洲日本VA一区二区三区,亚洲精品一区二区三区麻豆

非聚集索引中的臨界點(diǎn)(TippingPoint)-創(chuàng)新互聯(lián)

其他資訊

網(wǎng)站制作

企業(yè)服務(wù)

網(wǎng)站建設(shè)

服務(wù)器托管