先正面回答你的問(wèn)題
公司主營(yíng)業(yè)務(wù):成都網(wǎng)站建設(shè)、做網(wǎng)站、移動(dòng)網(wǎng)站開(kāi)發(fā)等業(yè)務(wù)。幫助企業(yè)客戶真正實(shí)現(xiàn)互聯(lián)網(wǎng)宣傳,提高企業(yè)的競(jìng)爭(zhēng)能力。創(chuàng)新互聯(lián)是一支青春激揚(yáng)、勤奮敬業(yè)、活力青春激揚(yáng)、勤奮敬業(yè)、活力澎湃、和諧高效的團(tuán)隊(duì)。公司秉承以“開(kāi)放、自由、嚴(yán)謹(jǐn)、自律”為核心的企業(yè)文化,感謝他們對(duì)我們的高要求,感謝他們從不同領(lǐng)域給我們帶來(lái)的挑戰(zhàn),讓我們激情的團(tuán)隊(duì)有機(jī)會(huì)用頭腦與智慧不斷的給客戶帶來(lái)驚喜。創(chuàng)新互聯(lián)推出岑鞏免費(fèi)做網(wǎng)站回饋大家。
數(shù)據(jù)是否重復(fù)不是建立索引的重要依據(jù),甚至都不是依據(jù)。
只要不完全重復(fù)(所有元組的該元素都一樣),那么建立索引就是有意義的。
即使當(dāng)前數(shù)據(jù)完全重復(fù),也不是不能建立索引,這種情況有點(diǎn)復(fù)雜,不細(xì)說(shuō)了。
對(duì)于你后面的疑問(wèn),可以給你一個(gè)如何建立索引的忠告,“如何查就如何建”。
索引的建立,唯一的原因就是為了查詢(廣義的查詢),實(shí)際上建立索引會(huì)使得數(shù)據(jù)存儲(chǔ)所占空間變大,有時(shí)索引所占的空間會(huì)查過(guò)數(shù)據(jù)本身的空間。索引的建立也會(huì)使得數(shù)據(jù)插入時(shí)變慢,特殊情況下,慢的難以忍受,所以dba的重要工作之一,就是檢查索引層級(jí)并優(yōu)化。
索引建立的唯一好處,就是按照索引查詢時(shí),變快了。type,status這2個(gè)字段是否適合建立索引,就要看你是否要按照這2個(gè)字段進(jìn)行檢索。而檢索的順序決定了如何建立索引。
對(duì)于索引類型和索引方式,我建議就
normal
和
btree
就適用于大多數(shù)情況。若你參與的是一個(gè)大數(shù)據(jù)處理項(xiàng)目,對(duì)數(shù)據(jù)存儲(chǔ)和檢索有特別要求,那么需要分析多個(gè)層面,比如數(shù)據(jù)吞吐量、數(shù)據(jù)的方差、平均差等等很多參數(shù)才考慮是否用聚集索引等(mysql好像還沒(méi)聚集索引),至于是否是唯一索引,我建議不使用,即使能判定數(shù)據(jù)是唯一的也不要用,全文索引也沒(méi)有必要。
首先說(shuō)說(shuō)索引的 優(yōu)點(diǎn) :最大的好處無(wú)疑就是提高查詢效率。有的索引還能保證數(shù)據(jù)的唯一性,比如唯一索引。
而它的 壞處 也很明顯:索引也是文件,我們?cè)趧?chuàng)建索引時(shí),也會(huì)創(chuàng)建額外的文件,所以會(huì)占用一些硬盤空間。其次,索引也需要維護(hù),我們?cè)谠黾觿h除數(shù)據(jù)的時(shí)候,索引也需要去變化維護(hù)。當(dāng)一個(gè)表的索引多了以后,資源消耗是很大的,所以必須結(jié)合實(shí)際業(yè)務(wù)再去確定給哪些列加索引。
再說(shuō)說(shuō)索引的基本結(jié)構(gòu)。一說(shuō)到這里肯定會(huì)脫口而出:B+樹(shù)!了解B+樹(shù)前先要了解二叉查找樹(shù)和二叉平衡樹(shù)。 二叉查找樹(shù) :左節(jié)點(diǎn)比父節(jié)點(diǎn)小,右節(jié)點(diǎn)比父節(jié)點(diǎn)大,所以二叉查找樹(shù)的中序遍歷就是樹(shù)的各個(gè)節(jié)點(diǎn)從小到大的排序。 二叉平衡樹(shù) :左右子樹(shù)高度差不能大于1。B+樹(shù)就是結(jié)合了它們的特點(diǎn),當(dāng)然,不一定是二叉樹(shù)。
為什么要有二叉查找樹(shù)的特點(diǎn)?? 因?yàn)椴檎倚士欤植檎以谶@種結(jié)構(gòu)下,查找效率是很快的。 那為什么要有平衡樹(shù)的特點(diǎn)呢? 試想,如果不維護(hù)一顆樹(shù)的平衡性,當(dāng)插入一些數(shù)據(jù)后,樹(shù)的形態(tài)有可能變得很極端,比如左子樹(shù)一個(gè)數(shù)據(jù)沒(méi)有,而全在右子樹(shù)上,這種情況下,二分查找和遍歷有什么區(qū)別呢?而就是因?yàn)檫@些特點(diǎn)需要去維護(hù),所以就有了上面提到的缺點(diǎn),當(dāng)索引很多后,反而增加了系統(tǒng)的負(fù)擔(dān)。
接著說(shuō)B+樹(shù)。 它的結(jié)構(gòu)如下 :
可以發(fā)現(xiàn),葉子節(jié)點(diǎn)其實(shí)是一個(gè) 雙向循環(huán)鏈表 ,這種結(jié)構(gòu)的好處就是,在范圍查詢的時(shí)候,我只用找到一個(gè)數(shù)據(jù),就可以直接返回剩余的數(shù)據(jù)了。比如找小于30的,只用找到30,其余的直接通過(guò)葉子節(jié)點(diǎn)間的指針就可以找到。再說(shuō)說(shuō)其他特點(diǎn): 數(shù)據(jù)只存在于葉子節(jié)點(diǎn) 。當(dāng)葉子節(jié)點(diǎn)滿了,如果再添加數(shù)據(jù),就會(huì)拆分葉子節(jié)點(diǎn),父節(jié)點(diǎn)就多了個(gè)子節(jié)點(diǎn)。如果父節(jié)點(diǎn)的位置也滿了,就會(huì)擴(kuò)充高度,就是拆分父節(jié)點(diǎn),如25 50 75拆分成:25為左子樹(shù),75為右子樹(shù),50變成新的頭節(jié)點(diǎn),此時(shí)B+樹(shù)的高度變成了3。它們的擴(kuò)充的規(guī)律如下表,Leaf Page是葉子節(jié)點(diǎn),index Page是非葉子節(jié)點(diǎn)。
再說(shuō)說(shuō)B樹(shù) ,B樹(shù)相比較B+樹(shù),它所有節(jié)點(diǎn)都存放數(shù)據(jù),所以在查找數(shù)據(jù)時(shí),B樹(shù)有可能沒(méi)到達(dá)葉子節(jié)點(diǎn)就結(jié)束了。再者,B樹(shù)的葉子節(jié)點(diǎn)間不存在指針。
最后說(shuō)說(shuō)Hash索引 ,相較于B+樹(shù),Hash索引最大的優(yōu)點(diǎn)就是查找數(shù)據(jù)快。但是Hash索引最大的問(wèn)題就是不支持范圍查詢。試想,如果查詢小于30的數(shù)據(jù),hash函數(shù)是根據(jù)數(shù)據(jù)的值找到其對(duì)應(yīng)的位置,誰(shuí)又知道小于30的有哪幾個(gè)數(shù)據(jù)。而B(niǎo)+樹(shù)正好相反,范圍查詢是它的強(qiáng)項(xiàng)。
附錄: Hash到底是啥?? 哈希中文名散列,哈希只是它的音譯。 為啥都說(shuō)Hash快?? 首先有一塊哈希表(散列表),它的數(shù)據(jù)結(jié)構(gòu)是個(gè)數(shù)組,一個(gè)任意長(zhǎng)度的數(shù)據(jù)通過(guò)hash函數(shù)都可以變成一個(gè)固定長(zhǎng)度的數(shù)據(jù),叫hash值。然后通過(guò)hash值確定在數(shù)組中的位置,相同數(shù)據(jù)的hash值是相同的,所以我們存儲(chǔ)一個(gè)數(shù)據(jù)以后,只需O(1)的時(shí)間復(fù)雜度就可以找到數(shù)據(jù)。 那hash函數(shù)又是啥?? 算術(shù)運(yùn)算或位運(yùn)算,很多應(yīng)用里都有hash函數(shù),但實(shí)際運(yùn)算過(guò)程大不一樣。這是Java里String的hashCode方法:
publicint hashCode() {
}
還有一個(gè)問(wèn)題,hash函數(shù)計(jì)算出來(lái)的hash值有可能存在碰撞,即兩個(gè)不同的數(shù)據(jù)可能存在相同的hash值,在MySQL或其他的應(yīng)用中,如Java的HashMap等,如果存在碰撞就會(huì)以當(dāng)前數(shù)組位置為頭節(jié)點(diǎn),轉(zhuǎn)變成一個(gè)鏈表。
說(shuō)到這里也清楚了為啥Java中引用類型要同時(shí)重寫(xiě)hashCode和equals了。兩個(gè)對(duì)象,實(shí)例就算一模一樣,它們的hash值也不相等, 為啥不相等?? 默認(rèn)的Object的hashCode方法會(huì)根據(jù)對(duì)象來(lái)計(jì)算hash值的,實(shí)例相同,但它們還是兩個(gè)不同的對(duì)象啊,所以我們重寫(xiě)hashCode時(shí),最簡(jiǎn)單的方法就是調(diào)用Object的hashCode方法,然后傳入該引用類型的屬性,讓hashCode方法只根據(jù)這幾個(gè)屬性來(lái)計(jì)算,那么實(shí)例相同的話,它們的hash值也會(huì)相等。等hashCode比較完后,如果相等再比較實(shí)例內(nèi)容,也就是equals,確保不是hash碰撞。
索引的分類
如果我們指定了一個(gè)主鍵,那么這個(gè)主鍵就是主鍵索引。如果我們沒(méi)有指定,Mysql就會(huì)自動(dòng)找一個(gè)非空的唯一索引當(dāng)主鍵。如果沒(méi)有這種字段,Mysql就會(huì)創(chuàng)建一個(gè)大小為6字節(jié)的自增主鍵。如果有多個(gè)非空的唯一索引,那么就讓第一個(gè)定義為唯一索引的字段當(dāng)主鍵,注意,是第一個(gè)定義,而不是建表時(shí)出現(xiàn)在前面的。
對(duì)于輔助索引來(lái)說(shuō),它們的B+樹(shù)結(jié)構(gòu)稍微有點(diǎn)特殊,它們的葉子節(jié)點(diǎn)存儲(chǔ)的是主鍵,而不是整個(gè)數(shù)據(jù)。所以在大部分情況下,使用輔助索引查找數(shù)據(jù),需要二次查找。但并不是所有情況都需要二次查找。比如查找的數(shù)據(jù)正好就是當(dāng)前索引字段的值,那么直接返回就行。這里提一句,B+樹(shù)的key就是對(duì)應(yīng)索引字段的內(nèi)容。
而輔助索引又有一些分類:唯一索引:不能出現(xiàn)重復(fù)的值,也算一種約束。普通索引:可以重復(fù)、可以為空,一般就是查詢時(shí)用到。前綴索引:只適用于字符串類型數(shù)據(jù),對(duì)字符串前幾個(gè)字符創(chuàng)建索引。全文索引:作用是檢測(cè)大文本數(shù)據(jù)中某個(gè)關(guān)鍵字,這也是搜索引擎的一種技術(shù)。
注意,聚集索引、非聚集索引和前面幾個(gè)索引的分類并不是一個(gè)層面上的。上面的幾個(gè)分類是從索引的作用來(lái)分析的。聚集、非聚集索引是從索引文件上區(qū)分的。主鍵索引就屬于聚集索引,即索引和數(shù)據(jù)存放在一起,葉子節(jié)點(diǎn)存放的就是數(shù)據(jù)。數(shù)據(jù)表的.idb文件就是存放該表的索引和數(shù)據(jù)。
輔助索引屬于非聚集索引,說(shuō)到這也就明白了。索引和數(shù)據(jù)不存放在一起的就是非聚集索引。在MYISAM引擎中,數(shù)據(jù)表的.MYI文件包含了表的索引, 該表的 葉子節(jié)點(diǎn)存儲(chǔ)索引和索引對(duì)應(yīng)數(shù)據(jù)的指針,指向.MYD文件的數(shù)據(jù)。
索引的幾點(diǎn)使用經(jīng)驗(yàn)
經(jīng)常被查詢的字段;經(jīng)常作為條件查詢的字段;經(jīng)常用于外鍵連接或普通的連表查詢時(shí)進(jìn)行相等比較字段;不為null的字段;如果是多條件查詢,最好創(chuàng)建聯(lián)合索引,因?yàn)槁?lián)合索引只有一個(gè)索引文件。
經(jīng)常被更新的字段、不經(jīng)常被查詢的字段、存在相同功能的字段
在mysql數(shù)據(jù)庫(kù)中為字段添加索引,意思是對(duì)數(shù)據(jù)庫(kù)某個(gè)表中一列或若干列值的集合和相應(yīng)的指向表中物理標(biāo)識(shí)這些值的數(shù)據(jù)頁(yè)進(jìn)行排序,它是邏輯指針清單。
索引提供指向存儲(chǔ)在表的指定列中的數(shù)據(jù)值的指針,然后根據(jù)指定的排序順序?qū)@些指針排序。數(shù)據(jù)庫(kù)使用索引以找到特定值,然后順指針找到包含該值的行。這樣可以使對(duì)應(yīng)于表的SQL語(yǔ)句執(zhí)行得更快,可快速訪問(wèn)數(shù)據(jù)庫(kù)表中的特定信息。
擴(kuò)展資料:
當(dāng)現(xiàn)有數(shù)據(jù)中存在重復(fù)的鍵值時(shí),大多數(shù)數(shù)據(jù)庫(kù)不允許將新創(chuàng)建的唯一索引與表一起保存。數(shù)據(jù)庫(kù)還可能防止添加將在表中創(chuàng)建重復(fù)鍵值的新數(shù)據(jù)。例如,如果在employee表中職員的姓(lname)上創(chuàng)建了唯一索引,則任何兩個(gè)員工都不能同姓。
對(duì)某個(gè)列建立UNIQUE索引后,插入新記錄時(shí),數(shù)據(jù)庫(kù)管理系統(tǒng)會(huì)自動(dòng)檢查新紀(jì)錄在該列上是否取了重復(fù)值,在CREATETABLE命令中的UNIQE約束將隱式創(chuàng)建UNIQUE索引。
mysql的索引類型及使用索引時(shí)的注意事項(xiàng)有:
一、普通索引。這是最基本的索引,它沒(méi)有任何限制。它有以下幾種創(chuàng)建方式:
1、創(chuàng)建索引
代碼如下:
CREATE INDEX indexName ON mytable(username(length));
如果是CHAR,VARCHAR類型,length可以小于字段實(shí)際長(zhǎng)度;如果是BLOB和TEXT類型,必須指定 length,下同。
2、修改表結(jié)構(gòu)
代碼如下:
ALTER mytable ADD INDEX [indexName] ON (username(length)) -- 創(chuàng)建表的時(shí)候直接指定
CREATE TABLE mytable(?? ID INT NOT NULL,??? username VARCHAR(16) NOT NULL,?? INDEX [indexName] (username(length))?? );?
-- 刪除索引的語(yǔ)法:
DROP INDEX [indexName] ON mytable;
二、唯一索引。它與前面的普通索引類似,不同的就是:索引列的值必須唯一,但允許有空值。如果是組合索引,則列值的組合必須唯一。它有以下幾種創(chuàng)建方式:
代碼如下:
CREATE UNIQUE INDEX indexName ON mytable(username(length))
-- 修改表結(jié)構(gòu)
ALTER mytable ADD UNIQUE [indexName] ON (username(length))
-- 創(chuàng)建表的時(shí)候直接指定
CREATE TABLE mytable(?? ID INT NOT NULL,??? username VARCHAR(16) NOT NULL,?? UNIQUE [indexName] (username(length))?? );
三、主鍵索引。它是一種特殊的唯一索引,不允許有空值。一般是在建表的時(shí)候同時(shí)創(chuàng)建主鍵索引:
代碼如下:
CREATE TABLE mytable(?? ID INT NOT NULL,??? username VARCHAR(16) NOT NULL,?? PRIMARY KEY(ID)?? );
當(dāng)然也可以用 ALTER 命令。記?。阂粋€(gè)表只能有一個(gè)主鍵。
四、組合索引。為了形象地對(duì)比單列索引和組合索引,為表添加多個(gè)字段:
代碼如下:
CREATE TABLE mytable(?? ID INT NOT NULL,??? username VARCHAR(16) NOT NULL,?? city VARCHAR(50) NOT NULL,?? age INT NOT NULL? );
為了進(jìn)一步榨取MySQL的效率,就要考慮建立組合索引。就是將 name, city, age建到一個(gè)索引里:
代碼如下:
ALTER TABLE mytable ADD INDEX name_city_age (name(10),city,age);[code]
建表時(shí),usernname長(zhǎng)度為 16,這里用 10。這是因?yàn)橐话闱闆r下名字的長(zhǎng)度不會(huì)超過(guò)10,這樣會(huì)加速索引查詢速度,還會(huì)減少索引文件的大小,提高INSERT的更新速度。
如果分別在 usernname,city,age上建立單列索引,讓該表有3個(gè)單列索引,查詢時(shí)和上述的組合索引效率也會(huì)大不一樣,遠(yuǎn)遠(yuǎn)低于我們的組合索引。雖然此時(shí)有了三個(gè)索引,但MySQL只能用到其中的那個(gè)它認(rèn)為似乎是最有效率的單列索引。
建立這樣的組合索引,其實(shí)是相當(dāng)于分別建立了下面三組組合索引:usernname,city,age?? usernname,city?? usernname? 為什么沒(méi)有 city,age這樣的組合索引呢?這是因?yàn)镸ySQL組合索引“最左前綴”的結(jié)果。簡(jiǎn)單的理解就是只從最左面的開(kāi)始組合。并不是只要包含這三列的查詢都會(huì)用到該組合索引,下面的幾個(gè)SQL就會(huì)用到這個(gè)組合索引:
[code]
SELECT * FROM mytable WHREE username="admin" AND city="鄭州"? SELECT * FROM mytable WHREE username="admin"