數(shù)據(jù)庫查詢相信很多人都不陌生,所有經(jīng)常有人調(diào)侃程序員就是CRUD專員,這所謂的CRUD指的就是數(shù)據(jù)庫的增刪改查。
創(chuàng)新互聯(lián)專注于紫陽企業(yè)網(wǎng)站建設(shè),成都響應(yīng)式網(wǎng)站建設(shè)公司,商城網(wǎng)站制作。紫陽網(wǎng)站建設(shè)公司,為紫陽等地區(qū)提供建站服務(wù)。全流程按需開發(fā)網(wǎng)站,專業(yè)設(shè)計,全程項目跟蹤,創(chuàng)新互聯(lián)專業(yè)和態(tài)度為您提供的服務(wù)
在數(shù)據(jù)庫的增刪改查操作中,使用最頻繁的就是查詢操作。而在所有查詢操作中,統(tǒng)計數(shù)量操作更是經(jīng)常被用到。
關(guān)于數(shù)據(jù)庫中行數(shù)統(tǒng)計,無論是MySQL還是Oracle,都有一個函數(shù)可以使用,那就是COUNT
但是,就是這個常用的COUNT函數(shù),卻暗藏著很多玄機(jī),尤其是在面試的時候,一不小心就會被虐。不信的話請嘗試回答下以下問題:
1、COUNT有幾種用法?
2、COUNT(字段名)和COUNT(*)的查詢結(jié)果有什么不同?
3、COUNT(1)和COUNT(*)之間有什么不同?
4、COUNT(1)和COUNT(*)之間的效率哪個更高?
5、為什么《阿里巴巴Java開發(fā)手冊》建議使用COUNT(*)
6、MySQL的MyISAM引擎對COUNT(*)做了哪些優(yōu)化?
7、MySQL的InnoDB引擎對COUNT(*)做了哪些優(yōu)化?
8、上面提到的MySQL對COUNT(*)做的優(yōu)化,有一個關(guān)鍵的前提是什么?
9、SELECT COUNT(*) 的時候,加不加where條件有差別嗎?
10、COUNT(*)、COUNT(1)和COUNT(字段名)的執(zhí)行過程是怎樣的?
以上10道題,如果您可以全部準(zhǔn)確無誤的回答的話,那說明你真的很了解COUNT函數(shù)了,如果有哪些知識點(diǎn)是不了解的,那么本文正好可以幫你答疑解惑。
1、認(rèn)識COUNT
關(guān)于COUNT函數(shù),在MySQL官網(wǎng)中有詳細(xì)介紹:
?
簡單翻譯一下:
1、COUNT(expr) ,返回SELECT語句檢索的行中expr的值不為NULL的數(shù)量。結(jié)果是一個BIGINT值。
2、如果查詢結(jié)果沒有命中任何記錄,則返回0
3、但是,值得注意的是,COUNT(*) 的統(tǒng)計結(jié)果中,會包含值為NULL的行數(shù)。
即以下表記錄
create?table?#bla(id?int,id2?int) insert?#bla?values(null,null) insert?#bla?values(1,null) insert?#bla?values(null,1) insert?#bla?values(1,null) insert?#bla?values(null,1) insert?#bla?values(1,null) insert?#bla?values(null,null)
使用語句count(*),count(id),count(id2)查詢結(jié)果如下:
select?count(*),count(id),count(id2) from?#bla results?7?3?2
除了COUNT(id)和COUNT(*)以外,還可以使用COUNT(常量)(如COUNT(1))來統(tǒng)計行數(shù),那么這三條SQL語句有什么區(qū)別呢?到底哪種效率更高呢?為什么《阿里巴巴Java開發(fā)手冊》中強(qiáng)制要求不讓使用 COUNT(列名)或 COUNT(常量)來替代COUNT(*)呢?
?
COUNT(列名)、COUNT(常量)和COUNT(*)之間的區(qū)別
前面我們提到過COUNT(expr)用于做行數(shù)統(tǒng)計,統(tǒng)計的是expr不為NULL的行數(shù),那么COUNT(列名)、 COUNT(常量) 和 COUNT(*)這三種語法中,expr分別是列名、 常量 和 *。
那么列名、 常量 和 *這三個條件中,常量 是一個固定值,肯定不為NULL。*可以理解為查詢整行,所以肯定也不為NULL,那么就只有列名的查詢結(jié)果有可能是NULL了。
所以, COUNT(常量) 和 COUNT(*)表示的是直接查詢符合條件的數(shù)據(jù)庫表的行數(shù)。而COUNT(列名)表示的是查詢符合條件的列的值不為NULL的行數(shù)。
除了查詢得到結(jié)果集有區(qū)別之外,COUNT(*)相比COUNT(常量) 和 COUNT(列名)來講,COUNT(*)是SQL92定義的標(biāo)準(zhǔn)統(tǒng)計行數(shù)的語法,因為他是標(biāo)準(zhǔn)語法,所以MySQL數(shù)據(jù)庫對他進(jìn)行過很多優(yōu)化。
SQL92,是數(shù)據(jù)庫的一個ANSI/ISO標(biāo)準(zhǔn)。它定義了一種語言(SQL)以及數(shù)據(jù)庫的行為(事務(wù)、隔離級別等)。
COUNT(*)的優(yōu)化
前面提到了COUNT(*)是SQL92定義的標(biāo)準(zhǔn)統(tǒng)計行數(shù)的語法,所以MySQL數(shù)據(jù)庫對他進(jìn)行過很多優(yōu)化。那么,具體都做過哪些事情呢?
這里的介紹要區(qū)分不同的執(zhí)行引擎。MySQL中比較常用的執(zhí)行引擎就是InnoDB和MyISAM。
MyISAM和InnoDB有很多區(qū)別,其中有一個關(guān)鍵的區(qū)別和我們接下來要介紹的COUNT(*)有關(guān),那就是MyISAM不支持事務(wù),MyISAM中的鎖是表級鎖;而InnoDB支持事務(wù),并且支持行級鎖。
因為MyISAM的鎖是表級鎖,所以同一張表上面的操作需要串行進(jìn)行,所以,MyISAM做了一個簡單的優(yōu)化,那就是它可以把表的總行數(shù)單獨(dú)記錄下來,如果從一張表中使用COUNT(*)進(jìn)行查詢的時候,可以直接返回這個記錄下來的數(shù)值就可以了,當(dāng)然,前提是不能有where條件。
MyISAM之所以可以把表中的總行數(shù)記錄下來供COUNT(*)查詢使用,那是因為MyISAM數(shù)據(jù)庫是表級鎖,不會有并發(fā)的數(shù)據(jù)庫行數(shù)修改,所以查詢得到的行數(shù)是準(zhǔn)確的。
但是,對于InnoDB來說,就不能做這種緩存操作了,因為InnoDB支持事務(wù),其中大部分操作都是行級鎖,所以可能表的行數(shù)可能會被并發(fā)修改,那么緩存記錄下來的總行數(shù)就不準(zhǔn)確了。
但是,InnoDB還是針對COUNT(*)語句做了些優(yōu)化的。
在InnoDB中,使用COUNT(*)查詢行數(shù)的時候,不可避免的要進(jìn)行掃表了,那么,就可以在掃表過程中下功夫來優(yōu)化效率了。
從MySQL 8.0.13開始,針對InnoDB的SELECT COUNT(*) FROM tbl_name語句,確實在掃表的過程中做了一些優(yōu)化。前提是查詢語句中不包含WHERE或GROUP BY等條件。
我們知道,COUNT(*)的目的只是為了統(tǒng)計總行數(shù),所以,他根本不關(guān)心自己查到的具體值,所以,他如果能夠在掃表的過程中,選擇一個成本較低的索引進(jìn)行的話,那就可以大大節(jié)省時間。
我們知道,InnoDB中索引分為聚簇索引(主鍵索引)和非聚簇索引(非主鍵索引),聚簇索引的葉子節(jié)點(diǎn)中保存的是整行記錄,而非聚簇索引的葉子節(jié)點(diǎn)中保存的是該行記錄的主鍵的值。
所以,相比之下,非聚簇索引要比聚簇索引小很多,所以MySQL會優(yōu)先選擇最小的非聚簇索引來掃表。所以,當(dāng)我們建表的時候,除了主鍵索引以外,創(chuàng)建一個非主鍵索引還是有必要的。
至此,我們介紹完了MySQL數(shù)據(jù)庫對于COUNT(*)的優(yōu)化,這些優(yōu)化的前提都是查詢語句中不包含WHERE以及GROUP BY條件。
COUNT(*)和COUNT(1)
介紹完了COUNT(*),接下來看看COUNT(1),對于,這二者到底有沒有區(qū)別,網(wǎng)上的說法眾說紛紜。
有的說COUNT(*)執(zhí)行時會轉(zhuǎn)換成COUNT(1),所以COUNT(1)少了轉(zhuǎn)換步驟,所以更快。
還有的說,因為MySQL針對COUNT(*)做了特殊優(yōu)化,所以COUNT(*)更快。
那么,到底哪種說法是對的呢?看下MySQL官方文檔是怎么說的:
InnoDB handles SELECT COUNT(*) and SELECT COUNT(1) operations in the same way. There is no performance difference.
畫重點(diǎn):same way , no performance difference。所以,對于COUNT(1)和COUNT(*),MySQL的優(yōu)化是完全一樣的,根本不存在誰比誰快!
那既然COUNT(*)和COUNT(1)一樣,建議用哪個呢?
建議使用COUNT(*)!因為這個是SQL92定義的標(biāo)準(zhǔn)統(tǒng)計行數(shù)的語法,而且本文只是基于MySQL做了分析,關(guān)于Oracle中的這個問題,也是眾說紛紜的呢。
COUNT(字段)
最后,就是我們一直還沒提到的COUNT(字段),他的查詢就比較簡單粗暴了,就是進(jìn)行全表掃描,然后判斷指定字段的值是不是為NULL,不為NULL則累加。
相比COUNT(*),COUNT(字段)多了一個步驟就是判斷所查詢的字段是否為NULL,所以他的性能要比COUNT(*)慢。
總結(jié)
本文介紹了COUNT函數(shù)的用法,主要用于統(tǒng)計表行數(shù)。主要用法有COUNT(*)、COUNT(字段)和COUNT(1)。
因為COUNT(*)是SQL92定義的標(biāo)準(zhǔn)統(tǒng)計行數(shù)的語法,所以MySQL對他進(jìn)行了很多優(yōu)化,MyISAM中會直接把表的總行數(shù)單獨(dú)記錄下來供COUNT(*)查詢,而InnoDB則會在掃表的時候選擇最小的索引來降低成本。當(dāng)然,這些優(yōu)化的前提都是沒有進(jìn)行where和group的條件查詢。
在InnoDB中COUNT(*)和COUNT(1)實現(xiàn)上沒有區(qū)別,而且效率一樣,但是COUNT(字段)需要進(jìn)行字段的非NULL判斷,所以效率會低一些。
因為COUNT(*)是SQL92定義的標(biāo)準(zhǔn)統(tǒng)計行數(shù)的語法,并且效率高,所以請直接使用COUNT(*)查詢表的行數(shù)!
讀者福利
加微信:haolagui521備注51CTO領(lǐng)取附送學(xué)習(xí)進(jìn)階架構(gòu)資料、PDF書籍文檔、面試資料